Compart - Dokumenten und Output-Management

PDF - Portable Document Format

PDF -
Portable Document Format

Das Portable Document Format (PDF) ist ein plattformübergreifendes Dateiformat, das von Adobe Systems entwickelt wurde und seit der Veröffentlichung der Version 1.7 als ISO 32000-1:2008 ein offener Standard ist. Die Internationale Organisation für Normung (ISO) hat PDF 2.0 mit ISO 32000-2:2020 als aktuellste Version der PDF-Spezifikation veröffentlicht. Wie bei vorherigen PDF-Versionen ist PDF 2.0 abwärtskompatibel.

Bedingt durch die zahlreichen Möglichkeiten zur Konvertierung unterschiedlicher Dateiformate in PDF unter weitgehender Beibehaltung des ursprünglichen Layouts, die Verfügbarkeit kostenloser PDF-Reader für alle gängigen Betriebssysteme und die Skalierbarkeit der Darstellung hat das Format weite Verbreitung gefunden. Neben dem klassischen PDF-Format existieren auch PDF-Formate für bestimmte Verwendungszwecke wie die Langzeitarchivierung von PDF-Dateien (PDF/A).

PDF und weitere Druckformate / Datenformate

PDF ist in vielerlei Hinsicht der ebenfalls von Adobe entwickelten Seitenbeschreibungssprache PostScript ähnlich. Anders als PostScript dient PDF jedoch nicht vorrangig der Erzeugung von gedruckten Ausgabedokumenten, sondern der unmittelbaren Anzeige von Dokumenten am Bildschirm. Dadurch bedingt werden Grafiken, Fonts, usw. in PDF zwar ähnlich behandelt wie in PostScript, darüber hinaus verfügt PDF aber über eine wachsende Zahl von Features, die dem Austausch von PDF-Dateien und der Benutzbarkeit am Bildschirm dienen.

Auch beschreiben PDF Dateien die Seiten eines Dokuments mittels Objekten (Boolean, Numeric, String, Name, Array, Dictionary, Stream, The Null Object und Indirect Objects) und der dazugehörigen Strukturinformationen. Hinzu kommen interaktive Elemente wie Formulare, Bookmarks, Soundobjekte und Thumbnails, die auf diese Weise nur in elektronischen Dokumenten wiedergegeben werden können. Um eine Darstellung auch auf Ausgabegeräten mit kleiner Anzeigefläche (PDAs, Mobiltelefone, SmartPhones etc.) zu optimieren, können in einem PDF sogenannte Auszeichnungen (ähnlich HTML-Tags) eingelagert werden. Diese ermöglichen ein Umbrechen der Seiteninhalte, allerdings mit eingeschränkter Layouttreue. Zudem erleichtern Sie das Konvertieren des Inhalts in andere Formate sowie das Vorlesen des Dokuments für sehbehinderte Nutzer mittels eines speziellen Programms (Barrierefreiheit).

PDF Dateien beschreiben das erzeugte Layout in einer vom Drucker und von Voreinstellungen unabhängigen Form weitgehend originalgetreu – einer der wesentlichen Unterschiede zu Beschreibungs- und Auszeichnungssprachen wie SGML und HTML bezüglich einer hohen Layouttreue.

PDF - Verbreitung und Vorteile

PDF Dokumente sind weltweit in nahezu allen Marktsegmenten zu finden und wegen der zahlreichen Vorteile sehr beliebt. Dazu zählen:
  • Portabilität

    PDF ist plattformunabhängig, das heißt, ein PDF Dokument, das beispielsweise mit einer Windows-Applikation erstellt wurde, lässt sich anschließend auf einem UNIX-Server verarbeiten und auf einem Mac-Rechner anschauen.
  • Extrafunktionen

    Das PDF Format baut auf der Seitenbeschreibungssprache PostScript auf, bietet darüber hinaus den direkten Zugriff auf Seiten sowie Features für Verschlüsselung, Komprimierung, interaktive Navigation uvm.
  • Industriestandard

    PDF hat sich zum international anerkannten ISO-Standard für den elektronischen Austausch von Dokumenten entwickelt. Zudem ist PDF heute das am meisten eingesetzte Format für die Produktion von Druckvorlagen in der digitalen Druckvorstufe.
  • Viewer/Reader

    Einer der Hauptgründe für die hohe Akzeptanz des Formats ist, dass es für alle gängigen Plattformen kostenlose Anzeige-Programme (Viewer/Reader) gibt. Das bedeutet, dass sich auf jeder Hardware- und Softwarearchitektur der Inhalt einer PDF Datei ohne grafischen Unterschied darstellen lässt.

Typisches Anwendungsszenario

Die Marketingabteilung eines Unternehmens entwirft einen Produktflyer und versendet ihn als PDF Datei per E-Mail zur Korrektur an die zuständigen Fachbereiche. Die Kollegen dort machen ihre Änderungen direkt im Dokument, schließlich geht das fertige Dokument zum Druckdienstleister, ohne dass Probleme mit fehlenden Schriftarten, unterschiedlich benutzten DTP-Programmen etc. auftreten. Gleichzeitig kann das PDF Dokument direkt ins Internet gestellt werden. Da der Acrobat Reader heute zur Standardausrüstung eines PC-Arbeitsplatzes gehört, ist das Dokument somit sofort lesbar.

Für besondere Verwendungszwecke kommen unterschiedliche PDF-Formate zum Einsatz. Dazu gehören die bekannten Formate wie PDF/A, PDF/A-1, PDF/A-2, PDF/A-3 (alle für die Langzeitarchivierung), PDF/E (spezielles PDF-Format für Ingenieurwesen / Engineering), PDF/UA (für barrierefreie PDF-Dokumente), PDF/VT (für variablen Datendruck) und PDF/X (für Druckereien durch ISO-Standards für Druckvorlagen / Offsetdruck).

Mehr zu den unterschiedlichen PDF Formaten

Technologische Unterstützung

Compart bietet mit dem MFFPDF Filter ein Formatierungs-Tool, das sowohl eingangs- als auch ausgangsseitig PDF und PDF/A unterstützt.

 

Austausch und die Darstellung elektronischer Dokumente wurde hier auf hohe Umsetzungstreue geachtet. Der MFFPDF unterstützt das Lesen (Input) der unterstützten Features in allen bekannten Versionen. Ausgangsseitig (Output) werden die PDF-Version 1.3 – 1.7 und PDF/A unterstützt.

Die MFF-Filter (Mixed Format Filter) von Compart sind die Basis der MFF-Architektur der DocBridge-Produkte. Es gibt MFF-Filter, die Dateien in verschiedenen Formaten lesen (Eingabefilter), andere wiederum dienen dazu, Dateien im jeweiligen Ausgabeformat zu schreiben (Ausgabefilter). In vielen Fällen wird ein Format sowohl eingangs- als auch ausgangsseitig unterstützt.

Die Stärke der Compart MFF-Architektur besteht darin, schnell und effektiv Dokumente, die in unterschiedlichen Formaten vorliegen, in andere zu konvertieren oder auch zu einem Dokument in einem bestimmten Format zusammenfassen zu können. So lassen sich beispielsweise Dokumente in AFP, PCL oder XML nach PDF konvertieren und ebenso zu einem einzigen PDF-Dokument zusammenfassen.

Bei der Konvertierung eines Formats in ein anderes verwendet Compart ein gemeinsames Objektformat, die sogenannte Presentation Area (PA), das die visuellen Daten und Metadaten aller unterstützten Formate repräsentieren kann. Ein MFF-Eingabefilter konvertiert eine Eingabedatei in das PA-Format im Hauptspeicher und ein MFF-Ausgabefilter wiederum wandelt das im Hauptspeicher abgelegte PA-Format in eine Ausgabedatei.

Compart Matrix

Compart Matrix PDF

Eine vollständige Übersicht der unterstützten Eingangs- und Ausgangsformate finden Sie in der Compart Matrix. Unsere marktführende Formate-Kompetenz ermöglicht einen zuverlässigen formatunabhängigen und äußerst flexiblen Umgang mit Dokumenten und Daten.

Compart Matrix

Video über Output-Formate

AFP, PDF, HTML oder XML? Welches Format ist nun besser?   >   Video jetzt ansehen

Farbräume im PDF

Die PDF-Spezifikation unterscheidet zwischen den folgenden Farbräumen, die zu unterschiedlichen Zeitpunkten eingeführt wurden:

 

Geräteabhängige Farbräume

Mithilfe der geräteabhängigen Farbräume können in den Seitenbeschreibungen Farbwerte angegeben werden, die sich auf die konkrete Darstellung auf einem Ausgabegerät beziehen. Der Nachteil dieser Farbräume ist, dass die abschließende Darstellung von einem Gerät zum nächsten voneinander abweichen kann.

  • DeviceGray
    (ab PDF-Version 1.0)
    Angabe eines Graustufenwerts auf einer Skala von 0.0 (schwarz) bis 1.0 (weiß)

  • DeviceRGB
    (ab PDF-Version 1.0)
    Angabe der drei zum RGB-Farbmodell gehörigen Werte, jeweils auf einer Skala von 0.0 (nicht vorhanden) bis 1.0 (maximale Intensität)

  • DeviceCMYK
    (ab PDF-Version 1.0)
    Angabe der vier zum subtraktiven CMYK-Farbmodell gehörigen Werte, jeweils auf einer Skala von 0.0 (nicht vorhanden) bis 1.0 (maximale Konzentration)

CIE-basierte Farbräume

Kalibrierte Farbräume werden in PDF mithilfe des internationalen CIE-Standards angegeben. Auf diese Weise können Farbwerte in Seitenbeschreibungen in Anlehnung an die menschliche Wahrnehmung angegeben werden, wodurch die Geräteabhängigkeit reduziert werden soll.

  • CalGray
    (ab PDF-Version 1.1)
    Spezialfall eines CIE-basierten A-Farbraums

  • CalRGB
    (ab PDF-Version 1.1)
    Spezialfall eines CIE-basierten ABC-Farbraums

  • Lab
    (ab PDF-Version 1.1)
    Spezialfall eines CIE-basierten ABC-Farbraums, in dem A, B und C die Komponenten L, a und b eines CIELab-Farbraums darstellen

  • ICCBased
    (ab PDF-Version 1.3)
    ICC-basierte Farbräume basieren auf plattformübergreifenden Farbprofilen, die vom International Color Consortium (ICC) entwickelt werden.

Spezielle Farbräume

Die speziellen Farbräume ergänzen die oben aufgeführten Farbräume um zusätzliche Funktionalität.

  • Indexed
    (ab PDF-Version 1.1)
    Die Indizierung dient dazu, Farbwertangaben klein zu halten und in einem weiteren Verarbeitungsschritt auf die Farben in einer Farbtafel zu mappen.

  • Pattern
    (ab PDF-Version 1.2)
    Mithilfe der Pattern (Füllmuster) können nicht mehr nur einzelne Farben für einen bestimmten Bereich angegeben werden.

  • Separation
    (ab PDF-Version 1.2)
    Separation-Farbräume ermöglichen es, die einzelnen Druckfarben zu berechnen und Sonderfarben zu erzeugen.

  • DeviceN
    (ab PDF-Version 1.3)
    DeviceN-Farbräume können eine beliebige Anzahl von Farbkomponenten enthalten.

Fonts

PDF bietet zwei Möglichkeiten zur Verwendung von Fonts:

 

  1. Dictionary

    Der Font wird im PDF mithilfe eines dictionary referenziert, welches Informationen über die Font-Art, die Kodierung sowie mögliche Ersatz-Fonts enthält. Zur Darstellung kann es erforderlich werden, den Font durch einen anderen zu ersetzen, wodurch es zu Abweichungen in der Darstellung kommen kann. Als Ersatz-Fonts bieten sich die 14 Fonts an, die PDF standardmäßig zur Verfügung stehen. (Die PostScript-Namen dieser Fonts sind: Times-Roman, Times-Bold, Times-Italic, TimesBoldItalic, Helvetica, Helvetica-Bold, Helvetica-Oblique, Helvetica-BoldOblique, Courier, Courier-Bold, Courier-Oblique, Courier-BoldOblique, Symbol, ZapfDingbats.)

  2. Eingebettet

    Der Font wird vollständig eingebettet. Dadurch kann der Font richtig wiedergegeben werden.

PDF unterstützt die folgenden Font-Typen:
  • Type0

    Type0 ist ein sogenanntes zusammengesetztes Format, das Glyphen in einem CID-Font referenziert.
  • Type1

    Type1 ist ein Outline-Zeichensatz von Adobe, der Glyphen in Postscript-Sprache darstellt und über Zeichennamen identifiziert. Darüber hinaus kann mit der Type1-Variante, Multiple Master Font, der Type1-Zeichensatz durch zusätzliche Definitionen erweitert werden.
  • Type3

    Type3 ist ein Outline-Zeichensatz von Adobe, der Glyphen mithilfe von Grafikoperatoren beschreibt.
  • TrueType

    TrueType ist ein Standard für die Darstellung von Outline-Fonts, der ursprünglich von Apple entwickelt wurde und heute in Windows- und MacOS-Betriebssysteme integriert ist. Die einzelnen Zeichen eines Fonts können in TrueType über die Unicode-Tabellen adressiert werden.
  • CIDfont

    CIDfonts wurden von Adobe entwickelt, um asiatische Font-Formate mit vielen unterschiedlichen Symbolen darstellen zu können. In CIDfonts werden CIDs (Character Identifiers) dazu verwendet, Glyphen-Beschreibungen im Font zu adressieren. Eine sogenannte CMap (Character Map) dient dazu, Korrespondenzen zwischen den CIDs und den Zeichencodes herzustellen.

Sicherheitseinstellungen

PDF-Dokumente können mit verschiedenen Sicherheitseigenschaften ausgezeichnet sein. Neben dem Setzen eines Passwortschutzes ist es auch möglich, das Dokument durch ein Zertifikat oder eine gemeinsame Sicherheitsrichtlinie auf einem Server zu sichern. Dabei ist allerdings zu beachten, dass nicht alle Sicherheitsmechanismen und -algorithmen in allen PDF-Versionen zur Verfügung standen. Um Rückwärtskompatibilität bzw. Benutzern von älteren Versionen von PDF-Readern, den Zugriff auf das Dokument zu ermöglichen, kann es erforderlich sein, einen Sicherheitsmechanismus auszuwählen, der auch in früheren Versionen bereits unterstützt wurde.

Bei Verwendung des Passwortschutzes können zwei verschiedene Passwörter vergeben werden:

 

  1. Dokumentpasswort

    Bei Vergabe dieses Passwortschutzes muss der Leser das Passwort eingeben, um das Dokument öffnen zu können.

  2. Berechtigungspasswort

    Mithilfe des Berechtigungspasswort ist es möglich, bestimmte Aktionen wie Drucken oder Kopieren von Dokumentinhalten mit einem Passwortschutz zu belegen. Benutzer können dann diese Aktionen nicht durchführen, es sei denn sie verfügen über das PDF-Passwort, um die entsprechenden Berechtigungen zu überschreiben oder zu ändern.

Der verwendete Verschlüsselungsmechanismus und die Schlüssellänge sollten abhängig von der PDF-Version ausgewählt werden:

  • 40-bit RC4: ab Version 1.2
  • 128-bit RC4: ab Version 1.4
  • 128-bit AES: ab Version 1.6
  • 256-bit AES: ab Version 1.7, Extension Level 3


Die oben beschriebenen Sicherheitsmerkmale werden von Adobe-Produkten entsprechend umgesetzt, aber nicht unbedingt von PDF-Readern anderer Hersteller.

Barrierefreie PDF-UA Dokumente erstellen