Compart - Dokumenten und Output-Management

Hub für smartes Input-Management

Digitaler Posteingang: Hub für smartes Input Management

Standardisierte Dokumentenaufbereitung mit zentraler Konvertierungsinstanz als Treiber für KI

 

Hub für smartes Input-Management

Geteilte Welt: Während im Output-Management vieler Unternehmen Papier immer noch den Ton angibt (man denke nur an Versicherungspolicen oder Vertragsunterlagen, für die qua Gesetz die Papierform vorgeschrieben ist), hat im Dokumenteneingang die Digitalisierung längst Einzug gehalten. Experten schätzen, dass etwa 80 Prozent der Korrespondenz inzwischen auf elektronischem Weg den Versicherer, die Bank oder den Energieversorger erreichen. Dabei ist, allen Unkenrufen zum Trotz, der „gute, alte“ E-Mail-Versand nach wie vor eine der wichtigsten Kanäle.

Zur Illustration: 80.000 E-Mails täglich sind bei einem Großunternehmen keine Seltenheit. Schadensmeldungen, Unfall-/Reparaturberichte, Kündigungen, Policen, Zeugnisse, Beglaubigungen, Adressänderungen – die Vielfalt an Dokumenten, die elektronisch verschickt werden, kennt keine Grenzen. Auch das Einstellen von Dokumenten auf Webportale erfreut sich immer größerer Beliebtheit.

Das Problem dabei: Die Palette an Formaten, in denen Dokumente ankommen, ist sehr groß; mitunter handelt es sich um sehr spezielle Formate, so dass der Empfänger Schwierigkeiten hat, den E-Mail-Anhang oder die Download-Datei überhaupt zu öffnen und zu lesen. Richtig kompliziert wird es, wenn es innerhalb einer E-Mail beispielsweise sehr unterschiedliche Dateien gibt (zum Beispiel Bildformate wie TIFF, JPG, PNG, kombiniert mit Office-Dokumenten oder PDF-Dateien). Das heißt, das Erfassen, Konvertieren und Zusammenstellen dieser verschiedenen E-Mail-Anhänge zu einem einzigen konsistenten Vorgang (elektronische Kundenakte) ist aufwändig und fehleranfällig.

Oft besitzen die E-Mail-Anhänge sehr proprietäre Formate, so dass sie erst einmal lesbar gemacht werden müssen. Mitunter wird mit Systemen gearbeitet, die E-Mails gar nicht oder nur beschränkt für die Weiterverarbeitung aufbereiten können. Noch immer werden in vielen Unternehmen eingehende E-Mails „vertifft“, also in ein Bildformat umgewandelt, um anschließend mittels OCR-Technologie Teile des Dokumenteninhalts wieder interpretierbar zu machen. Das ist „tiefstes Dokumenten-Mittelalter“. Es verschleißt unnötig Ressourcen, vor allem, wenn man bedenkt, dass heutzutage E-Mail-Anhänge recht komplexe Dokumente mit zig Seiten sein können.

Statt Content zu vernichten...

Vor allem aber kommt dieser Medienbruch einem „Daten-Gau“ gleich: Da werden elektronische Dokumente (E-Mails), die an sich von IT-Systemen gelesen und verarbeitet werden könnten, erst einmal in TIFF-, PNG oder JPG-Dateien umgewandelt. Aus Content entstehen also „Pixelwolken“. Mit anderen Worten: Der eigentliche Inhalt wird erst verschlüsselt (Rasterbilder) und dann wieder mittels Optical Character Recognition (OCR) mühsam „lesbar“ gemacht. Das geht mit dem Verlust von semantischen Strukturinformationen einher, die für eine spätere Wiederverwendung notwendig sind.

Wie schön wäre es doch, wenn man E-Mail-Anhänge gleich welchen Typs beispielsweise sofort nach Eingang in hochauflösende Farb-PDF konvertieren könnte? Damit wäre die Grundlage für eine langfristige, revisionssichere Archivierung gelegt; schließlich ist die Umwandlung von PDF nach PDF/A nur ein kleiner Schritt.

Wie schön wäre es doch, wenn man E-Mail-Anhänge gleich welchen Typs beispielsweise sofort nach Eingang in hochauflösende Farb-PDF konvertieren könnte? Damit wäre die Grundlage für eine langfristige, revisionssichere Archivierung gelegt; schließlich ist die Umwandlung von PDF nach PDF/A nur ein kleiner Schritt.

...lieber erhalten als Grundlage für weitere Automatisierung

Dazu folgendes Beispiel: Ein führender deutscher Versicherungskonzern bekommt über ein zentrales elektronisches Postfach täglich zig Tausende E-Mails, sowohl von Endkunden als auch von ex- und internen Vertriebspartnern. Sofort nach Empfang werden vom System automatisch die folgenden Prozesse „angestoßen“:

  • Konvertierung der eigentlichen E-Mail („Body“) nach PDF/A
  • Individuelle Konvertierung des E-Mail-Anhangs (z. B. verschiedene Office-Formate, Bilddateien wie TIFF, JPG etc.) nach PDF/A
  • Zusammenführung des E-Mail-Body mit den entsprechenden Anhängen und Generierung einer einzelnen PDF/A-Datei pro Geschäftsvorgang
  • Gleichzeitig werden aus der Datei alle wichtigen Informationen ausgelesen (extrahiert) und zentral für nachgelagerte Prozesse vorgehalten (z. B. Generierung von Antwortschreiben auf KI-Basis, fallabschließende Sachbearbeitung, Archivierung).

Alles läuft automatisiert und ohne Medienbruch. Der Sachbearbeiter bekommt das Dokument in einem standardisierten Format, ohne dass er sich um die Aufbereitung (klassifizieren, lesbar machen) kümmern muss.

Dabei könnte der Versicherer den Workflow noch „splitten“ in die Dunkel- und die interaktive Verarbeitung. Bei der Dunkelverarbeitung wird grundsätzlich jede ankommende E-Mail plus Anhang automatisch in ein PDF/A umgewandelt, an die Sachbearbeitung übergeben und abschließend archiviert.

Bei der interaktiven Verarbeitung dagegen geht es um das „intelligente“ Zusammenstellen von E-Mail-Dokumenten unterschiedlichen Dateiformats zu einem elektronischen Dossier (Kundenakte/-vorgang). Der Sachbearbeiter öffnet zunächst auf seinem Mail-Client (Outlook, Lotus Notes etc.) die E-Mail und den Anhang und entscheidet, was bearbeitet werden muss. Danach greift der normale Workflow wie bei der Dunkelverarbeitung: Konvertierung – Weiterleitung - Bearbeitung – Archivierung.

Die interaktive Variante ist vor allem dann sinnvoll, wenn nicht alle Dokumente archiviert werden müssen. Moderne Input-Management-Systeme sind inzwischen in der Lage, alle gängigen Formate von E-Mail-Anhängen automatisch zu erkennen und in ein vorgegebenes Standardformat (zum Beispiel PDF/A oder PDF/UA) zu konvertieren. Und: Sie extrahieren aus den Dokumenten alle notwendigen Daten gleich mit und legen sie zentral ab.

Daten sind die Grundlage für KI-Prozesse

Wie auch immer - die Vorzüge einer automatisierten Verarbeitung mit revisionssicherer Archivierung sind offensichtlich: hohe Rechtssicherheit (Compliance) und Effizienz (Entlastung der Sachbearbeiter). Wie schön wäre es deshalb, wenn sich nicht nur E-Mails auf diese Weise verarbeiten ließen, sondern jede Art von elektronischem Input – unabhängig davon, auf welchem Kanal und in welchem Format und Umfang dieser ankommt. Gesucht wird quasi ein „Trichter“, der jedes Dokument entgegennimmt, es in ein les-, archivier- und durchsuchbares Format umwandelt und allen nachgelagerten Prozessen und Anwendungen zur Verfügung stellt.

Doch es geht hier nicht nur um Konvertierung. Vielmehr spielt das Extrahieren und Mitführen von Informationen eine entscheidende Rolle.  Ziel ist es letztlich, den Content möglichst zu erhalten und daraus wichtige Daten zu generieren. Mittlerweile stellen die Fachabteilungen in Unternehmen diesbezüglich hohe Anforderungen. So verlangen beispielsweise Marketing und Vertrieb nach immer detaillierteren Informationen, um noch gezielter Kunden anzusprechen. Hinzu kommt: Daten sind auch die Grundlage für Prozesse, die auf künstlicher Intelligenz (KI) basieren. Stichwort ist hier zum Beispiel die automatisierte Generierung von Antwortschreiben bei Standardanfragen, wie sie bereits in vielen Unternehmen zum Einsatz kommen.

Dreh- und Angelpunkt: Zentrale Konvertierungsinstanz

Auf den Punkt gebracht: Moderne elektronische Eingangsverarbeitung für alle Kanäle bedarf einer zentralen Plattform, die folgende Kriterien erfüllt:

  • Professionelles Handling mit ankommenden Nachrichten jedes Typs, jeder Struktur und jedes Eingangskanals (E-Mail, Webportal, Faxe, Messenger-Dienste, Office-Dokumente, Images etc.)
  • Standardisierte und automatisierte Aufbereitung in les-, archivier- und durchsuchbare Formate
  • Erhaltung von Content
  • automatisiertes Extrahieren, Vorhalten und Mitführen von Daten
  • Möglichkeit zur Etablierung einer stringenten Verarbeitungslogik (Was soll mit dem Dokument geschehen? Wie soll es verarbeitet werden (interaktiv oder „dunkel“? In welches Format soll konvertiert werden? Wer ist für die fallabschließende Sachbearbeitung zuständig? Welche Dokumente bedürfen einer gesonderten Genehmigung? Soll ein spezieller Freigabeworkflow installiert werden / Vier-Augen-Prinzip? Welche Daten sind für die automatisierte Weiterverarbeitung relevant und müssen daher extrahiert und zentral vorgehalten werden?)
  • Analyse/Klassifizierung (Ermitteln der Dokumentenart: Worum geht es in der Korrespondenz/Anliegen? Um welchen Geschäftsvorgang handelt es sich?) und automatisierte Weiterleitung an den Fachbereich
  • Automatisierte Zuordnung zu einem bestehenden Geschäftsvorgang/Zusammenführung des neu angekommenen Dokuments mit Unterlagen anderer Eingangskanäle – Bündelung zu einer elektronischen Akte)
  • Fähigkeit, nachgelagerte Prozesse anzustoßen
  • Abbildung unterschiedlicher Konvertierungs- und Verarbeitungsstrecken
  • Professionelles Handling mit kurzfristigen Peaks und Lastspitzen

Dreh- und Angelpunkt solch einer Plattform ist eine zentrale Konvertierungsinstanz, die den unstrukturierten Input analysiert und zu einem standardisierten Format aufbereitet, das sich gezielt nach Informationen durchsuchen lässt. Schließlich ist die gezielte Dokumentenrecherche und die Möglichkeit der Extraktion des Contents ein Grundbedürfnis moderner Kommunikation.

Dabei gibt es einen weiteren neuralgischen Punkt. Als Folge von Fusionen oder Übernahmen existieren oft mehrere Archivsysteme gleichzeitig in einem Konzern und sind teilweise 30 Jahre alt. Oftmals fehlen auch klar definierte Regeln für die Archivierung (In welchem Format und wo soll archiviert werden? Wer darf das Dokument bearbeiten? Welche Metadaten und Suchkriterien sollen hinterlegt werden?). Alles keine guten Bedingungen für eine schnelle und gezielte Dokumentenrecherche.

Tatsache ist, dass eine standardisierte, zentrale Konvertierung die Grundlage jeder modernen Archivierung ist. Warum also die Automatisierung des digitalen Posteingangs nicht auch für die Konsolidierung heterogener Archivsysteme nutzen?

Die Kür wäre dann, die Prozesse des Input-Managements mit denen der Outbound-Kommunikation zu verknüpfen und in einem einzigen IT-System abzubilden – schließlich weisen beide viele Gemeinsamkeiten auf. Hier wie dort ist jedenfalls eine zentrale Datenhaltung das A und O. Es gibt keinen plausiblen Grund, sie nach wie vor organisatorisch und technologisch getrennt voneinander zu betreiben.

Wir freuen uns auf Ihren Kontakt