Compart - Dokumenten und Output-Management

Entwicklung und Technologie

Digitaler Versand: Präsent auf allen Kanälen

Compart |

Der digitale Versand (multichannel) verdrängt den physikalischen

– mit der Folge, dass Dokumente jeden Formats und jeder Quelle multichannel-fähig gemacht werden müssen. Am besten schon zum Zeitpunkt ihrer Erstellung. HTML5 und PDF spielen dabei eine entscheidende Rolle.

Europaweit sinkt das Aufkommen an physischen Dokumenten. Aktuelle Erhebungen der Universal Postal Union (UPU) sprechen von einem Rückgang im zweistelligen Bereich. Schon heute verschicken viele Unternehmen Rechnungen, Kontoauszüge etc. elektronisch als E-Mail-Anhang oder stellen sie als Downloaddatei in Webportale. Tendenz steigend. Im digitalen Versand liegen riesige Einsparpotenziale, denn die Kosten für Druck und Porto fallen weg. Vor allem bei Transaktionsdokumenten kommen da schon mal sechsstellige Summen zusammen. Daher schreitet die Digitalisierung hier auch am schnellsten voran. Wahrscheinlich wird in einigen Jahren weit mehr als die Hälfte aller Dokumente elektronisch versendet; selbst Versicherungspolicen, Vertragskündigungen und Schreiben, die aus rechtlichen Gründen heute noch an die Papierform gebunden sind, werden sicher irgendwann ebenfalls auf diesem Weg verschickt. Druck und physischer Versand bleibt dann Schriftstücken vorbehalten, bei denen Haptik und Optik wichtig sind, vor allem Mailings, hochwertige Produktkataloge und Imagebroschüren. Papier entwickelt sich somit zunehmend zum Premium-Produkt.

HTML5 für alle Fälle

Wie auch immer – das Verhältnis zwischen physikalischem und digitalem Versand verschiebt sich und beeinflusst die Erstellung insgesamt. Die Herausforderung hier: jedes Dokument, egal welcher Art, so aufzubereiten und mit Strukturinformationen zu versehen, dass es auf jedem Ausgabekanal darstellbar ist. Das bedeutet, dass sich Output-Management-Systeme von der A4-Metapher lösen und Inhalte auch für elektronische Ausgabegeräte bereitstellen müssen, unabhängig von der Größe des Displays oder Bildschirms. Man denke nur an PC-Tablet, Smartphone etc., die im Businessalltag zunehmend zum mobilen Büro werden. Mit anderen Worten: Die ursprünglich nur für den Druck vorgesehenen Dokumente werden zu multikanalfähigen umgewandelt. Dazu „reichert“ man sie auf ihrem Weg zur Ausgabe mit möglichst vielen Informationen wie Metadaten, Hyperlinks und Hinweisen zur Textstrukturierung an.

Vor diesem Hintergrund spielt das Format HTML5 eine entscheidende Rolle bei der Strukturierung und semantischen Beschreibung von Dokumenten (siehe Glossar). Die textbasierte Auszeichnungssprache gibt schon heute auf mobilen Plattformen wie iPhone, iPad und Android-Geräten den Ton an. Kein Wunder, Inhalte in HTML5 lassen sich problemlos für alle elektronischen Ausgabekanäle aufbereiten, für Smartphone & Co. genauso wie als Webseite. Bei Bedarf lässt sich das HTML5-Dokument zusätzlich drucken oder anderweitig physikalisch ausgeben. Auch die Konvertierung in PDF-Dateien jeder beliebigen Seitengröße ist möglich.

Multichannel Dokumente sind auch intelligente Dokumente

HTML5 ist derzeit das intelligenteste Format für die größen- und kanalunabhängige Erstellung und Darstellung von Dokumenten. Es ermöglicht die Reformatierung, beispielsweise von A4 zum Smartphone-Display, die Konvertierung von Seitenformate in textorientierte Formate, die Extraktion von Einzeldaten (u.a. Rückgewinnung von Rechnungspositionen) und den Aufbau von Inhaltsverzeichnissen und Indexlisten. Mehr noch: Mit HTML5 lassen sich auch audiovisuelle Elemente, Weblinks und Charts einbetten. So entstehen auf diese Weise nicht nur multichannel, sondern auch intelligente Dokumente, die dem Nutzer einen über die reine Textdarstellung hinausgehenden Mehrwert bieten.

Infobox

Lesedauer: 4 Min

  • HTML5 als Format für die Erstellung von multichannel Dokumenten
  • Anreicherung mit Metadaten
  • Papier wird zum Premiumprodukt

Was liegt also näher, als ein Output-Management-System (OMS) so auszurichten, dass alle Dokumente von Anfang an in HTML5 erstellt werden – oder zumindest in PDF, denn auch dieses Format ist bereits sehr fortgeschritten in Sachen Hinterlegung von Strukturinformationen? Doch viele Unternehmen halten sich damit (noch) zurück. Sie haben in der Regel viel Zeit und Geld in ihre Systeme investiert und sind verständlicherweise für neue Formatierungstools schwer zu begeistern. Sie stehen somit vor der Frage, wie sich aus den bestehenden Anwendungen (Legacy-Anwendungen) zumindest ein Teil an Strukturinformationen für die Weiterverarbeitung wie auch für den digitalen Versand (multichannel) gewinnen lassen.

OMS-Anbieter und Dienstleister wie Compart haben sich genau darauf spezialisiert, Grunddaten aus bereits fertig formatierten Dokumenten innerhalb der Legacy-Systeme „auszulesen“ und als HTML5- oder XML-Dateien aufzubereiten, die dann um zusätzliche Informationen weiter aufgewertet können, beispielsweise um Farbe oder Video- und Audiodateien.

Zurück zur Quelle

Letztlich geht es darum, die textuellen Quellen innerhalb der Dokumenterzeugung zu identifizieren. Wo kommen die Daten her? Lassen sich aus den Quellen genügend Strukturinformationen für die Wiederverwendung extrahieren? Fragen, die am Anfang jeder Betrachtung stehen müssen, wenn es darum geht, Dokumente „intelligent“ zu machen. Fakt ist: Die heute oft anzutreffende Vernichtung von Informationen auf dem Weg zur Ausgabe, über welchen Kanal auch immer, ist nicht mehr zeitgemäß. Oft werden digitale Dokumente, die an sich von Maschinen gelesen und verarbeitet werden könnten, erst in eine analoge Form, also gedruckt, und dann in TIF- oder JPG-Dateien umgewandelt. Aus Content entstehen „Pixelwolken“. Der eigentliche Inhalt wird erst verschlüsselt (Rasterbilder) und dann wieder mittels Optical Character Recognition (OCR) „lesbar“ gemacht. Das ist nicht nur umständlich, sondern geht mit dem Verlust von semantischen Strukturinformationen einher, die für eine spätere Wiederverwendung notwendig sind. Nicht so, wenn man Dokumente in einem Format erzeugt, das die für die Ausgabe notwendigen Daten mit sich führt und der Inhalt dadurch auf allen Kanälen dargestellt werden kann – ob nun als Webseite, als digitaler Versand, auf einem mobilen Endgerät oder auch als Druck.

 

Hintergrundwissen:

HTML5 ist eine textbasierte Auszeichnungssprache zur Strukturierung und semantischen Beschreibung von Dokumenten. Sie findet bereits breite Anwendung, vor allem auf mobilen Geräten, und wird demnächst vom World Wide Web Consortium (W3C) als offizieller Standard verabschiedet. Das Besondere des neuen Formats: Es bietet zahlreiche Funktionalitäten für Grafik (2D-/3D-Grafiken) und Multimedia (Audio/Video), die von bisherigen Standards wie HTML 4.01 und XHTML nicht direkt unterstützt werden. Nützlich an HTML5 ist auch die Einbettung von Web-Fonts. Damit lassen sich mittels eines Browser auch „Hausschriften“ von einem Server herunterladen. Unterstützt ein Browser die HTML5-Schriftarten nicht, werden sie durch einen Standardfont wie Arial oder Verdana ersetzt.

Features von HTML5 im Überblick

Erweiterung der layoutbezogenen Elemente
  • Stärkere Trennung von Semantik und Layout (CSS)
  • Stringente Auszeichnung von ausgewählten Bereichen einer Website
  • Zusätzliche Elemente für häufig genutzte Seitenbereiche wie <footer> und <section>
SVG

Scalable Vector Graphics (SVG) ist eine vom W3C empfohlene Spezifikation zur Erstellung von komplexen, zweidimensionalen Vektorgrafiken in Dokumenten. Da SVG ein XML-basiertes Format ist, sind Inhalte von SVG-Dateien für computerunterstützte Übersetzung und andere Weiterverarbeitungen leicht zugänglich Sie können prinzipiell auch direkt mit einem Texteditor bearbeitet werden.

MathML

Die Mathematical Markup Language (MathML) ist ein Format zur Darstellung mathematischer Formeln im Internet.

Canvas

Damit können Programmierer pixelgenaue Grafiken im Browserfenster erzeugen. Ergänzt um JavaScript lassen sich somit komplexe Animationen, Spiele und dynamische Geschäftsgrafiken erstellen, für die zuvor das Adobe-Flash-Format oder andere Plug-Ins notwendig waren.

Video

Mittels des neuen Elements <video> lassen sich Videos in Websites einbetten, ohne externe Plugins wie Apple QuickTime oder Adobe Flash Player benutzen zu müssen.

Geolocation

Die neue JavaScript-Funktion „Geolocation“ ermöglicht es, einer Webseite den Aufenthaltsort eines Besuchers mitzuteilen, der mit einem mobilen Gerät darauf zugreift. Auf diese Weise können ortsbezogene Services angeboten und dem Nutzer der Webseite beispielsweise Geschäfte in seiner Nähe oder seine Position auf einer Karte angezeigt werden.

Offline-Webanwendungen

Mit HTML5 können Websites entwickelt werden, die auch offline nutzbar sind. Dafür muss der Webserver dem Browser des Besuchers lediglich mitteilen, welche Daten er hierfür laden muss. Eine Synchronisierung der Daten erfolgt automatisch, sobald der User wieder online ist.

Mikrodaten

Dieses Feature stattet Webseiten mit zusätzlichen semantischen Informationen aus und wandelt beispielsweise die Kontaktdaten in eine vCard um.