Unicode-Zeichen, Fonts und Schriftsysteme
Theoretisch lässt sich mit der aktuellen Unicode-Version nahezu jedes Schriftsystem dieser Welt abdecken. Nur: Kein Font unterstützt alle Zeichen. Die Frage ist daher, wie weit ein Unternehmen in Sachen Unicode gehen sollte.
Wenn es um die digitale Kodierung von Schriftzeichen geht, werden recht schnell einige Mankos deutlich. Zwar setzen die meisten Unternehmen inzwischen Unicode oder mehrere Codepages ein, welche die grundlegenden Buchstaben des lateinischen Alphabets abdecken. Doch bei Sonderzeichen, anderen Alphabeten oder selten genutzten diakritischen Zeichen, stoßen viele schnell an ihre Grenzen. Das ist natürlich problematisch, denn Namen von Personen, Produkten, Marken, Adressen etc., die besondere Buchstaben enthalten, werden dann zum Teil unterschiedlich erfasst oder fehlerhaft dargestellt – je nachdem, welcher Zeichensatz gerade verwendet wird. Vor allem in der öffentlichen Verwaltung handelt es sich hier um einen sensiblen Punkt, denn mit der korrekten Schreibweise können juristische Aspekte verknüpft sein. Zudem haben in vielen EU-Ländern sowie in den USA und Kanada die Bürger einen Rechtsanspruch auf die Richtigkeit ihres Namens, wobei die Transkription mitunter zu Schwierigkeiten führt.
Zum Verständnis: Wenn beispielsweise der Name Møller in manchen Unternehmen als Möller oder Moller geführt wird (weil deren Zeichensatz das ø nicht enthält), schlägt die Suche in der Kundendatenbank oder im Melderegister möglicherweise fehl, weil der Name in abweichender Schreibweise geführt wird.
Unicode: Auf das Wichtige konzentrieren
Auf den ersten Blick ließe sich dieses Problem mit Unicode lösen, denn die aktuelle Version dieses Zeichensatzstandards ist in der Lage, nahezu alle Schriften dieser Welt abzudecken. Tatsächlich sind in der aktuellen Version weit über 100.000 Zeichen berücksichtigt.
Nur – was nützen einem die mehr als eine Million theoretisch zur Verfügung stehenden Unicode-Zeichen, wenn sie nicht von den eingesetzten Fonts unterstützt werden? Bekanntlich genügt es nicht, die Buchstaben bzw. Zeichen zu kodieren – sie müssen sich auch darstellen lassen.
Viele gängige Fonts haben mit 400 bis 500 Zeichen einen sehr begrenzten Umfang. Da stößt man schnell an Grenzen, wenn man bedenkt, dass sich beispielsweise in Deutschland allein die Behörden schon auf 700 einheitlich zu verwendende Buchstaben und Symbole geeinigt haben.