Compart - Dokumenten und Output-Management

Entwicklung und Technologie

Lokalisierung von Content: Mehr als nur Übersetzen

Jeremias Märki |

Mehrsprachigkeit in der Dokumentenverarbeitung

Mehrsprachigkeit in der Dokumentenverarbeitung: In Ländern wie Indien, Kanada und der Schweiz ist sie ein Muss. Aber auch Unternehmen, die in der Kundenkommunikation mehr als das notwendige Minimum bieten wollen, kommen daran nicht vorbei. Fakt ist: In der Multikulti-Gesellschaft von heute ist für immer mehr Menschen die primäre Landessprache nicht unbedingt auch die Muttersprache. Warum also diesen Umstand nicht als Wettbewerbsvorteil nutzen und Inhalte entsprechend anpassen?

Ausgangspunkt ist die Tatsache, dass es im Dokumenten- und Output-Management heute um Inhalte (Content) geht. Diese müssen je nach Ausgabekanal in der vom Empfänger gewünschten Sprache aufbereitet werden. In diesem Zusammenhang nur von einer Übersetzung von Texten zu sprechen, greift zu kurz. Nicht umsonst spricht man in diesem Zusammenhang von Lokalisierung.

Stufe 0 ‒ Keine Lokalisierung

Um die Relevanz und Komplexität des Themas besser verstehen zu können, bietet sich ein Gedankenspiel mit verschiedenen Schwierigkeitsstufen an, beginnend beim Level 0: Hier geht es um die Frage, ob man Lokalisierung in einem konkreten Fall überhaupt braucht? Fakt ist: In vielen Ländern mit nur einer einzigen Amtssprache (z.B. Deutschland oder Österreich) wird die Lokalisierung noch gerne vernachlässigt. Zwar gibt es regional meist noch weitere Amtssprachen (z.B. Slowenisch in Teilen Österreichs), jedoch spielt dieser Umstand außerhalb der Kommunikation mit Behörden so gut wie keine Rolle. Doch die Situation ändert sich. Betrachtet man einmal den Anteil von Migranten an der Gesamtbevölkerung (inkl. Nachkommen der 1. und 2. Generation), kommt Deutschland auf 19 Prozent (2011); in Österreich sind es rund 20 Prozent (2014) und in der Schweiz gar 36 Prozent (2013). Die meisten von ihnen werden sicherlich eine Amtssprache soweit beherrschen, um auch komplexe Dokumente zu verstehen. Jedoch gibt es im deutschsprachigen Raum auch sehr viele Fälle, wo Englisch die geeignetere Sprache als Deutsch wäre, beispielsweise bei ausländischen Spezialisten, die nur für ein paar Monate oder Jahre im Land bleiben.

Mehrsprachigkeit im Dokumentenmanagement

In der Abwägung, ob sich der Aufwand für die Lokalisierung lohnt, muss man die interessanten Zielgruppen eruieren und analysieren. Zur Illustration: In Deutschland sind mehr als drei Prozent der Versicherungskunden türkischstämmig. In absoluten Zahlen: Bei mehr als zwei Millionen Versicherten besteht die Möglichkeit, dass sie Türkisch besser verstehen als Deutsch. Und Kleingedrucktes kann ja schon in der Muttersprache schwer verständlich sein. Warum also nicht gleich Dokumente produzieren, die für eine wichtige Kundenklientel besser zu verstehen sind?

Stufe 1 – Mehrsprachigkeit mit Empfängern nur im Inland

Hat man sich also einmal für die Lokalisierung entschieden, gilt es weitere Fragen zu klären; beispielsweise, ob mehrsprachige Dokumente nur für Empfänger im Inland produziert werden sollen. In diesem Fall muss man sich noch nicht um länderspezifische Besonderheiten Gedanken machen. Trotzdem reicht es hier nicht aus, nur von Übersetzung zu sprechen. Neben Texten sind nämlich unter Umständen auch Bilder oder Grafiken anzupassen. Gerade in personalisierten Geschäftsdokumenten finden sich Variablen mitten im Text, so dass Fallunterscheidungen notwendig werden. Diese müssen je nach Sprache recht unterschiedlich gehandhabt werden. Allein in Deutsch können die drei Fälle (0, 1 und n) folgende Umsetzungen nach sich ziehen: "..hat keine weiteren Policen..." oder "...hat eine weitere Police..." oder "...hat 3 weitere Policen...". Man kann also nicht einfach einen einfachen Platzhalter benutzen wie "...hat {anzahl} Policen..."

Ein Aspekt in diesem Zusammenhang ist die Trennung von Geschäfts- und Sprachlogik. Diese beiden sollten nämlich voneinander entkoppelt und nacheinander betrachtet bzw. umgesetzt werden. Beispiel Kfz-Versicherung: Etliche Versicherer bieten ihren Kunden einen Rabatt, wenn sie ihr Auto zu Hause in der Garage parken. Das bedeutet: In der Geschäftslogik, die einmal durchlaufen wird, führt das auf der einen Seite in der Berechnung zu einem Rabatt. Andererseits werden für das Output Management Rohdaten zur Verfügung gestellt, die aufgrund dieser Regel einen Indikator enthalten, dass im Dokument später ein entsprechender Textblock (z.B. über einen eindeutigen Namen identifiziert) auftauchen soll. Der eigentliche Text spielt zu diesem Zeitpunkt keine Rolle.

Später bei der Formatierung (Composition) werden der entsprechende Textblock in der richtigen Variante ausgewählt und die darin enthaltenen Platzhalter sprachabhängig ersetzt. Die Sprachlogik dabei muss also mehrfach pro Sprache und vielleicht sogar pro Ausgabeformat (Print/PDF, HTML etc.) umgesetzt werden.

Neben der komplexen Ersetzung von Variablen bei der Lokalisierung müssen weitere Elemente beachtet werden. Ein Datumswert aus einer XML-Datei wie z.B. "2015-10-16" (ISO 8601 bzw. XML Schema Format) muss nach "16. Oktober 2015" oder "16.10.2015" formatiert werden. Auch Beträge sind entsprechend aufzubereiten. Darüber hinaus ist gerade beim Layout zu beachten, dass einige Sprachen wesentlich längere Texte verursachen als andere und sich dadurch Zeilen- und Seitenumbrüche ändern können. So ist Deutsch beispielsweise weniger kompakt als Englisch. Ein weiterer Aspekt kann die Sortierung sein: In Deutschland besagt DIN 5007, dass in Wörterbüchern beispielsweise "ä" und "a" als gleichwertig zu behandeln sind, nicht jedoch in Telefonbüchern. Dort sind aber "ä" und "ae" bzw. "æ" gleichwertig.

Betrachtet man die kompletten Systeme, drängt sich die durchgehende Verwendung des Unicode-Standards auf, um in Zukunft auch für weitere Sprachen gerüstet zu sein. Ein westeuropäischer 8 Bit Zeichensatz (z.B. ISO 8859-1) wird auf Dauer nicht ausreichen. Alle Elemente in der Systemlandschaft müssen die Mehrsprachigkeit unterstützen: Applikationen, Output Management und Austauschformate. Es geht eben um die Internationalisierung des Gesamtsystems.

 

Stufe 2 – Jenseits der Landesgrenze

 

Versendet ein Unternehmen Dokumente auch ins Ausland, wird es noch einmal komplizierter. Dabei spielt das Thema nicht nur im Outputmanagement eine Rolle. Es kann auch in die Konzeption von Internetauftritten mit internationalem Publikum einfließen. Plötzlich müssen Zahlen- und Datumswerte je nach Land unterschiedlich formatiert werden. Während in Deutschland ein Betrag als "7654,12 €" gesetzt wird, liest man in Österreich eher "7 654,12 €" und in der Schweiz "Fr. 7654.12". Man beachte die Tausendertrennzeichen, den Dezimalseparator und die Position des Währungssymbols. Auch eine Telefonnummer wird je nach Land unterschiedlich dargestellt.

Ein anderes Beispiel sind Wörter, die je nach Land anders geschrieben werden. In der Schweiz wird kein scharfes S ("ß") verwendet. "Straße" wird zu "Strasse". Auch die Wortwahl kann sehr unterschiedlich sein: "Sahne" (DE), "Obers" (AT) und "Rahm" (CH). Man kommt also von der Sprachabhängigkeit zusätzlich noch in die Landesabhängigkeit. Hier werden auf der technischen Seite Codes wie "de_DE" und "de_AT" verwendet, um beide Aspekte auszuzeichnen. Es können sogar noch weitere Merkmale wie die Region angehängt werden, wenn man es sehr weit treiben will.

Die Wahl von Datenstrukturen bei Austauschformaten wie XML kann ebenfalls noch etwas heikel sein, wenn man zum Beispiel in die Adressformatierung verzweigt. Da kann die Postleitzahl schon mal hinter (USA) oder unter (England) dem Ort platziert sein. Die folgende Grafik macht das Ganze deutlich.

Compart AG
Otto-Lilienthal-Str. 38
71034 Böblingen
Deutschland

Compart North America Inc.
30 Bridge Street, Suite 2
New Milford, CT 06776
United States

Compart AG
88 Wood Street
London
EC2V 7RS
United Kingdom

Weitere Aspekte kommen hinzu. Maße können unterschiedlich sein: °C versus °F, Zentimeter versus Zoll, Meter versus Fuß. Vielleicht muss je nach Zielland sogar auf unterschiedliches Papier gedruckt werden (DIN A4 versus US-Letter). Schnell spielen auch Zeitzonen und die Sommerzeit eine Rolle.

Stufe 3 – Zielgruppen & Kultur

In jedem Land gibt es unterschiedliche gesetzliche Anforderungen, die Auswirkungen auf die ausgestellten Dokumente haben können. Beispielweise müssen spezielle Regeln bei der Besteuerung (Mehrwertsteuer) beachtet werden. Auch die Vorgaben für die Preisauszeichnung können unterschiedlich sein. Das sind nur ein paar Beispiele zum Thema internationale Regelkonformität (Compliance).

Ein weiteres Thema in der Lokalisierung ist die Ausrichtung auf Zielgruppen. Dabei spielen Aspekte wie Kultur, Religion, Ästhetik, Bedeutung von Farben, Kleider und Titel in der Anrede eine Rolle. Ein bekanntes Beispiel ist das Foto mit der netten Dame vom Kundendienst, die ein Headset trägt und in die Kamera lächelt. Im deutschsprachigen Raum hat sie in der Regel kaukasische Gesichtszüge, ein modisches, europäisches Outfit und keine Kopfbedeckung. So weit, so gut. Doch empfiehlt sich diese Darstellung auch in anderen Ländern, beispielsweise in afrikanischen oder asiatischen? Wohl kaum.

Lokalisierung Dokumenten

Von der Relevanz unterschiedlicher Wortwahl wurde bereits gesprochen. Noch komplexer wird es, wenn jenseits der lateinischen Sprachen unterschiedliche Schreibrichtungen umgesetzt werden müssen. Beispielsweise Hebräisch oder Arabisch mit "RL-TB" (von rechts nach links und dann von oben/top nach unten/bottom) oder auch traditionelle, asiatische Schriften mit "TB-RL" (von oben nach unten und dann von rechts nach links). Rechtschreibung und Silbentrennung sind hier sehr unterschiedlich.

Stichwort Kalender: Auch hier gibt es Unterschiede. Feiertage sind sehr regional, und der erste Tag in der Woche muss nicht überall der Montag sein. Auch der bei uns übliche Gregorianische Kalender ist nicht auf der ganzen Welt gültig. Man denke nur an asiatische Staaten wie Thailand, wo man sich eher an der buddhistischen Zeitrechnung orientiert.
Es gibt also viele Aspekte in der Lokalisierung, die mehr oder weniger große Herausforderungen darstellen. Wie weit man gehen will (oder muss), ist situativ zu betrachten und zu entscheiden.

Inhalt versus Präsentation

Neben der Entkopplung von Geschäfts- und Sprachlogik kommt es bei der Internationalisierung auch auf die Unterscheidung von Inhalt und Präsentation an. Dabei geht es unter anderem um folgende Fragen:

  • Wie bildet man die Informationen ab in Austauschformaten, die weitestgehend sprachunabhängig sein sollen?
  • Wie präsentiert man diese Informationen dem Empfänger?
  • Muss eine Adresse in einem strukturierten Format abgelegt werden oder schon formatiert vorliegen, damit man es am besten umsetzen kann? Oder führt man gleich beide Formate?
  • Wo setzt man welche Aspekte um? In der Fachapplikation, im Output Management oder anderswo? Lassen sich bestimmte Themen zentral für alle Ausgabekanäle realisieren, so dass sie nicht mehrfach in möglichweise unterschiedlichen Technologien umgesetzt werden müssen?

Hier hilft die strikte Trennung des Inhaltes von der Präsentation unter Zuhilfenahme geeigneter Technologien (wie z.B. XML). Indem man die einzelnen Aufgaben in nacheinander gelagerte Prozessschritte aufteilt, lässt sich die Komplexität reduzieren. Außerdem gibt es beispielsweise beim Unicode Consortium verschiedene Hilfsdatenbanken, die bei der Lokalisierung helfen können. Empfohlen sei an dieser Stelle das Common Locale Data Repository (CLDR ).

Aus der Pflicht eine Kür machen

Kurz: Lokalisierung ist mehr als nur Übersetzung. Viele Faktoren gilt es hier zu beachten. Natürlich müssen nicht immer alle Aspekte behandelt werden. Der Artikel soll vielmehr dazu anregen, sich wieder einmal Gedanken zu diesem Thema zu machen. Ein Unternehmen kann sich möglicherweise bei seiner Kundschaft wesentliche Pluspunkte holen, wenn es in der Kundenkommunikation mehr als nur die Pflichtsprache(n) anbietet. Lokalisierung kann also sowohl aus einer Notwendigkeit als auch aus eigenem Antrieb heraus angegangen werden.

Getrieben wird Lokalisierung vor allem durch steigende Compliance-Anforderungen sowie von den Marketingabteilungen in den Unternehmen. Sicher: Vor der Umsetzung muss das Kosten-Nutzen-Verhältnis betrachtet und entschieden werden, wie weit man gehen will. Die Auswirkungen in die Systemlandschaft können aber noch recht weit gehen, weshalb es bei Systemablösungen immer auch sinnvoll ist, sich mit dem Thema Lokalisierung im Dokumenten- und Outputmanagement zu beschäftigen.

Autor: Jeremias Märki, freier Softwareentwickler und Berater im Auftrag der Compart AG