Standardisierte Dokumentenaufbereitung mit zentraler Konvertierungsinstanz als Treiber für KI
Geteilte Welt: Während im Output-Management vieler Unternehmen Papier immer noch den Ton angibt (man denke nur an Versicherungspolicen oder Vertragsunterlagen, für die per Gesetz die Papierform vorgeschrieben ist), hat im Dokumenteneingang die Post-Digitalisierung längst Einzug gehalten. Experten schätzen, dass etwa 80 Prozent der Korrespondenz inzwischen auf elektronischem Weg den Versicherer, die Bank oder den Energieversorger erreichen. Dabei ist, allen Unkenrufen zum Trotz, der „gute, alte“ E-Mail-Versand nach wie vor eine der wichtigsten Kanäle.
Zur Illustration: 80.000 E-Mails täglich sind bei einem Großunternehmen keine Seltenheit. Schadensmeldungen, Unfall-/Reparaturberichte, Kündigungen, Policen, Zeugnisse, Beglaubigungen, Adressänderungen – die Vielfalt an Dokumenten, die elektronisch verschickt werden, kennt keine Grenzen. Auch das Einstellen von Dokumenten auf Webportale erfreut sich immer größerer Beliebtheit.
Das Problem dabei: Die Palette an Formaten, in denen Dokumente ankommen, ist sehr groß; mitunter handelt es sich um sehr spezielle Formate, so dass der Empfänger Schwierigkeiten hat, den E-Mail-Anhang oder die Download-Datei überhaupt zu öffnen und zu lesen. Richtig kompliziert beim Inputmanagement wird es, wenn es innerhalb einer E-Mail beispielsweise sehr unterschiedliche Dateien gibt (zum Beispiel Bildformate wie TIFF, JPG, PNG, kombiniert mit Office-Dokumenten oder PDF-Dateien). Das heißt, das Erfassen, Konvertieren und Zusammenstellen dieser verschiedenen E-Mail-Anhänge zu einem einzigen konsistenten Vorgang (elektronische Kundenakte) ist aufwändig und fehleranfällig.
Oft besitzen die E-Mail-Anhänge sehr proprietäre Formate, so dass sie erst einmal lesbar gemacht werden müssen. Mitunter wird mit Input-Systemen gearbeitet, die E-Mails gar nicht oder nur beschränkt für die Weiterverarbeitung aufbereiten können. Noch immer werden in vielen Unternehmen eingehende E-Mails „vertifft“, also in ein Bildformat umgewandelt, um anschließend mittels OCR-Technologie Teile des Dokumenteninhalts wieder interpretierbar zu machen. Das ist „tiefstes Dokumenten-Mittelalter“. Es verschleißt unnötig Ressourcen, vor allem, wenn man bedenkt, dass heutzutage E-Mail-Anhänge recht komplexe Dokumente mit zig Seiten sein können.
Statt Content zu vernichten...
Vor allem aber kommt dieser Medienbruch einem „Daten-Gau“ gleich: Da werden elektronische Post und Dokumente (E-Mails), die an sich von IT-Systemen gelesen und verarbeitet werden könnten, erst einmal in TIFF-, PNG oder JPG-Dateien umgewandelt. Aus Content entstehen also „Pixelwolken“. Mit anderen Worten: Der eigentliche Inhalt wird erst verschlüsselt (Rasterbilder) und dann wieder mittels Optical Character Recognition (OCR) mühsam „lesbar“ gemacht. Das geht mit dem Verlust von semantischen Strukturinformationen einher, die für eine spätere Wiederverwendung notwendig sind.
Wie schön wäre es doch, wenn man E-Mail-Anhänge gleich welchen Typs beispielsweise sofort nach Eingang in hochauflösende Farb-PDF konvertieren könnte? Damit wäre die Grundlage für eine langfristige, revisionssichere Archivierung gelegt; schließlich ist die Umwandlung von PDF nach PDF/A nur ein kleiner Schritt.
Wie schön wäre es doch, wenn man E-Mail-Anhänge gleich welchen Typs beispielsweise sofort nach Eingang in hochauflösende Farb-PDF konvertieren könnte? Damit wäre die Grundlage für eine langfristige, revisionssichere Archivierung gelegt; schließlich ist die Umwandlung von PDF nach PDF/A nur ein kleiner Schritt.
...lieber erhalten - als Basis für weitere Schritte der Digitalisierung der Eingangspost
Dazu folgendes Beispiel: Ein führender deutscher Versicherungskonzern bekommt über ein zentrales elektronisches Postfach täglich zig Tausende E-Mails, sowohl von Endkunden als auch von ex- und internen Vertriebspartnern.