Erzeugung von Dateien nach dem PDF/A-1b-Standard mit Compart
ISO-Standard PDF/A DocBridge Mill Profileinstellungen
Der PDF/A-1b-Standard
PDF/A ist der ISO-Standard für die Langzeit-Archivierung elektronischer Dokumente, der sicherstellt, dass auch in vielen Jahren ein Dokument noch in der gleichen Form reproduzierbar ist, wie es erzeugt wurde. Insofern gilt er auch als der Archivierungsstandard der Zukunft. Diese Norm spezifiziert zwei Konformitäts-Ebenen.
PDF/A-1b (basic):
Auf dieser Ebene muss die eindeutige visuelle Reproduzierbarkeit gegeben sein. Das Dokument muss also später bei der Reproduktion identisch aussehen, die Inhalte können aber intern ohne Bezug zueinander festgelegt sein.
PDF/A-1a (accessible):
PDF/A-1a in der zusätzlich der Text nach Unicode abbildbar und das Dokument inhaltlich so strukturiert sein muss, dass auch der inhaltliche Zusammenhang zugänglich ist, also die Texte des Dokuments sich automatisch auslesen lassen, wie es für barrierefreie Dokumente notwendig ist, damit sie durch ein Programm vorlesbar werden.
Ausführlichere Informationen dazu sind auf der Website des PDF/A Competence Center www.pdfa.org zu finden.
Voraussetzungen zur Erzeugung von PDF/A-1b-Dateien
Die Compart-Produkte unterstützen die Erzeugung von Dateien, die dem PDF/A-1b-Standard genügen. Die auf diese Weise erzeugten Dateien lassen sich daher direkt an ein Archiv übergeben und sich somit zukunftssicher archivieren.
Für den Benutzer von DocBridge-Produkten liegt da die Frage nahe: Wie kann ich denn nun - beispielsweise mit DocBridge Mill - PDF/A-Dateien erzeugen?
Das Beste vorweg: Wenn Sie für DocBridge Mill bereits den Ausgangsfilter MFFPDF für PDF-Output lizenziert haben und über eine aktuelle Version des Produkts verfügen, haben Sie automatisch alles beieinander, was Sie von Compart im Rahmen dieses Produkts für die Erzeugung von PDF/A-1b brauchen.
Abhängig vom Format der zu konvertierenden Datenströme brauchen Sie natürlich noch die passenden Input-Filter sowie die eventuell darin referenzierten Ressourcen. Doch dazu unten mehr.
In einem PDF/A-Dokument müssen sämtliche zur Darstellung notwendigen Informationen im Dokument selbst enthalten sein, also alle Texte, Bilddaten, Vektorgrafiken, Schriften und Farbräume. Bereits diese Anforderung mag bei einem in PDF/A umzuwandelnden Dokument in der einen oder anderen Form nicht gegeben sein.
Welche Profileinstellungen im PDF-Ausgangsfilter mffpdf.pro werden benötigt?
Um mit DocBridge Mill PDF/A-1b zu erzeugen, müssen in dem Profil des PDF-Ausgangsfilter mffpdf.pro im <output>-Abschnitt zwei Tags angespasst werden: <version> und <outputintent>.
Für das <version>-Tag sollten folgende Parameter gesetzt sein:
1. Als Ausgabeformat muss value="pdf/a" als Ausgabeformat eingestellt sein.
2. level="b" gibt an, dass es sich um PDF/A-1b handeln soll.
3. Das Attribut strict muss auf TRUE gesetzt werden. Der strict-Modus soll gewährleisten, dass nach einem nicht abgebrochenen Lauf in jedem Fall alle Kriterien für PDF/A-1b erfüllt sind. Wenn in dieser Einstellung PDF/A-Bedingungen nicht erfüllt sind, wird der Vorgang entweder mit einer Fehlermeldung abgebrochen oder es wird versucht, den Konflikt automatisch aufzulösen.
Damit sieht dieses Tag folgendermaßen aus:
<version value="pdf/a" level="b" strict="TRUE"/>
Darüber hinaus muss in der Profildatei mffpdf.pro der <outputintent> vorgegeben werden. Er gibt an, für welche Ausgabebedingung eine PDF-Datei erstellt werden soll, um ein dafür geeignetes Farbprofil vorzugeben. Er kann z. B. folgendermaßen lauten:
<outputintent name="Adobe RGB (1998)" />
Adobe RGB (1998) kann zum Beispiel bei Ausgabe auf einem Bildschirm verwendet werden. Zum eingestellten <outputintent> muss ein geeignetes "ICC-Farbprofil" von DocBridge Mill gefunden werden können. (Was unter einem solchen Farbprofil zu verstehen ist, können Sie auf der Website www.color.org nachlesen, und zwar unter dem Abschnitt "What is an ICC Profile?".)
Die Output-Intent-Einstellung Adobe RGB (1998) erwartet zwingend eine Datei AdobeRGB1998.icc - vorausgesetzt, für ICC-Dateien ist in der <resourcelist> der mffpdf.pro die Endung icc vorgesehen. Sorgen Sie dafür, dass Pfade zu allen Ressourcen wie zum ICC-Farbprofil in der <resourcelist> vorhanden sind.
Weitere Ressourcen, die in die Ausgabedatei eingebettet werden müssen, sind, wie schon erwähnt, Schriften (Fonts). Ein Weg, dieses Ziel zu erreichen, ist, in der Profildatei mffpdf.pro das <fonthandling> auf CONVERTTOTYPE3 einzustellen. Vorausgesetzt, dem Input-Filter stehen alle nötigen Daten zur Verfügung, erzeugt dann DocBridge Mill so selbst einen aus den Font-Ressourcen auf der Eingangsseite umgesetzten Typ-3-Font in der PDF-Datei.
Um Abbrüche durch die Schutzmechanismen im MFFPDF-Filter zur Sicherstellung einer PDF/A-Ausgabe zu vermeiden, sollte außerdem vermieden werden, dass DocBridge Mill einen Binary Copy (Binäres Kopieren) oder ein Binary Stamping (Binäres Stempeln) ausführt. Diese Verarbeitungsweisen können dann auftreten, wenn auch input-seitig PDF zu verarbeiten ist.
Beim Modul cpmill von DocBridge Mill setzen Sie den "Binarycopy"-Modus auf "never". Achten Sie darauf, dass Sie dies auch für jedes selbst geöffnete FileOutputDocument explizit tun. Diese Einstellung verhindert dann auch das "Binary Stamping".
Der gleiche Effekt wird beim Modul cpmcopy von DocBridge Mill mit den Optionsparametern -nobinarycopy und -nobinarystamp erreicht.
Beobachten Sie bitte die Ausgaben im Log, um zu erkennen, ob ihre sonstigen Einstellungen mit dem Vorhaben, PDF/A-Dateien zu erzeugen, kollidieren. Nähere Einzelheiten, wie die entsprechenden Optionen zu verwenden sind, können Sie im "DocBridge Mill Administration Guide" nachlesen.
Abschließend empfehlen wir, mit einem Validierungs-Werkzeug nachzuprüfen, ob die Konfigurationen zum Erfolg geführt haben.