Compart - Dokumenten und Output-Management

XML

XML

Extensible Markup Language

 

XML - die eXtensible Markup Language, ist eine vom World Wide Web Consortium (W3C) nach ISO normierte Auszeichnungssprache zur Darstellung hierarchisch strukturierter Daten in Form von Textdaten. XML wird u. a. für den plattformunabhängigen Austausch von Daten zwischen Computersystemen eingesetzt, insbesondere über das Internet.

W3C definiert XML als eine Metasprache, auf deren Basis durch strukturelle und inhaltliche Einschränkungen anwendungsspezifische Sprachen definiert werden. Dazu gehören unter anderem XSL-FO (vor allem im Druck-/Archivierungsbereich), XHTML (webbasierte Applikationen) und SVG.

In XML werden alle Elemente streng strukturiert, vergleichbar mit der aus der Windows-Welt bekannten Menübaumstruktur. Dabei bestimmt stets ein einleitendes Schlüsselwort (Start-Tag) und ein abschließendes Keyword (End-Tag) die jeweilige Strukturebene (Klammern). XML ist sehr gut geeignet, um Daten strukturiert darzustellen. Was fehlt, ist der Bezug zum gedruckten Dokument. Dieser kann durch zusätzliche Formatierungsinformationen hergestellt werden. Sei es durch CSS (Cascading Style Sheets), einer Stilsprache, die das Aussehen von HTML-Dokumenten definiert; oder durch XSL-FO (eXtensible Stylesheet Language Formatted Objects), die beschreibt, wie Text, Bilder, Linien und andere grafische Elemente auf einer Seite angeordnet werden, vor allem von Dokumenten, die gedruckt oder archiviert werden sollen.

Äußerlich ähnelt XML dem im Internet üblichen HTML (Hypertext Markup Language)-Protokoll. Der wichtigste Unterschied besteht darin, dass man die in XML verwendeten Symbole ("Tags") in weiten Grenzen frei wählen kann, während sie in HTML fest definiert sind. Dadurch lassen sich spezielle Formen von XML für fast beliebige Anwendungen bilden. Daher ist XML vielseitig einsetzbar.

Ein weiterer Vorteil: XML ist leicht zu generieren, zu verarbeiten und beliebig erweiterbar.

 

Verbreitung von XML

Angesichts dieser Vorteile löst XML die Sprache SGML (Standard Generalized Markup Language) als ISO-Standard für die Dokumentenrepräsentation immer mehr ab. XML ist in vielen Bereichen des Lebens zu finden, u.a. als

  • RSS-Feed
  • Login beim E-Mail-Account (via SAML)
  • XHTML-basierte Webseiten
  • PowerPoint-Präsentationen
  • Leistungsabrechnungen
  • Konfigurationsdateien

Branchen mit hoher XML-Verarbeitung:

  • Gesundheits- und Sozialwesen
  • Öffentliche Verwaltungen
  • Finanzdienstleister
  • ITK
  • Energieversorgung

 

Anwendungsszenarien

Beispiel 1: Technische Dokumentation mit XML

  • Inhalte werden beispielsweise in DocBook (XML) erstellt.
  • Multi-Channel Publishing über einen XML-Workflow mit XSLT

Beispiel 2: Elektronische Leistungsabrechnung im Gesundheitswesen (Schweiz)

  • XML für die elektronische Kommunikation zwischen Leistungserbringer und Kostenträger
    verhindert Medienbruch und beschleunigt die Prozesse
  • Patient bekommt ein PDF oder ein Papierdokument, das von einem externen Druckdienstleister produziert wird.

XML Elektronische Leistungsabrechnung

 Quelle: Jeremias Märki, IT Software-Entwicklung und Beratung

 

Technologische Unterstützung

Compart bietet mit der Produktreihe DocBridge einschließlich der Mixed Format Filter (MFF) die Möglichkeit, von XSL-FO, XHTML, OOXML und SVG in alle gängigen Formate wie AFP, PostScript, PDF, IPDS etc. zu konvertieren. XSL-FO-Dokumente werden nach dem SAX-Verfahren (Simple API for XML) verarbeitet. Dabei wird die Datei Zeile für Zeile gelesen. Ist eine Seite fertig, wird diese dem entsprechenden Ausgabefilter übergeben.

 

Hintergrund

Die MFF-Filter (Mixed Format Filter) von Compart sind die Basis der MFF-Architektur der DocBridge-Produkte. Es gibt MFF-Filter, die Dateien in verschiedenen Formaten lesen (Eingabefilter), andere wiederum dienen dazu, Dateien im jeweiligen Ausgabeformat zu schreiben (Ausgabefilter). In vielen Fällen wird ein Format sowohl eingangs- als auch ausgangsseitig unterstützt.

Die Stärke der Compart MFF-Architektur besteht darin, schnell und effektiv Dokumente, die in unterschiedlichen Formaten vorliegen, in andere zu konvertieren oder auch zu einem Dokument in einem bestimmten Format zusammenfassen zu können. So lassen sich beispielsweise Dokumente in AFP, SAPGOF oder PCL nach PDF konvertieren und ebenso zu einem einzigen PDF-Dokument zusammenfassen.

Bei der Konvertierung eines Formats in ein anderes verwendet Compart ein gemeinsames Objektformat, die sogenannte Presentation Area (PA), das die visuellen Daten und Metadaten aller unterstützten Formate repräsentieren kann. Ein MFF-Eingabefilter konvertiert eine Eingabedatei in das PA-Format im Hauptspeicher und ein MFF-Ausgabefilter wiederum wandelt das im Hauptspeicher abgelegte PA-Format in eine Ausgabedatei.

 

XML Konvertierungsrichtungen

Beispiele:
XML nach AFP
XML nach IPDS
XML nach PCL
XML nach PDF
XML nach PostScript

Alle XML Konvertierungsrichtungen finden Sie in der Compart Matrix (PDF)

InFocus Video über Output-Formate

AFP, PDF, HTML oder XML? Welches Format ist nun besser?   >   Video jetzt ansehen

Compart Matrix

Eine vollständige Übersicht der unterstützten Eingangs- und Ausgangsformate finden Sie in der Compart Matrix. Unsere marktführende Formate-Kompetenz ermöglicht einen zuverlässigen formatunabhängigen und äußerst flexiblen Umgang mit Dokumenten und Daten.

Compart Matrix öffnen (PDF)