Compart - Dokumenten und Output-Management

Schriften, Fonts, Codepages

Schriften, Fonts,
Codepages – Begrifflichkeiten

„Das Wort Schrift 1 steht unter anderem für Zeichensysteme zur Bewahrung und Weitergabe von gesprochener oder anders kodierter Information. Vormals per Hand geschrieben und nur (visuell) lesbar oder (haptisch) erfassbar, können heutige Niederschriften oder Schriftstücke auch in für Menschen nicht unmittelbar nutzbarer Form vorliegen, um über technisches Gerät lesbar gemacht zu werden oder gar der Steuerung des Gerätes selber zu dienen. Generell wird Schrift auf einem Träger (z. B. Papier, digitaler Speicher) notiert (geschrieben oder auf eine andere Weise auf den Träger gebracht) und zur Nutzung dekodiert (abgelesen, z. B. zur geistigen Aufnahme oder zur Steuerung eines Geräts)."

Die Schrift

Charakteristiken von Schriften (Fonts)

  • Bitmap-Fonts / Raster–Fonts

    Darstellung der Zeichen als Pixelgrafik, auch bekannt als Bitmap-Schrift 2
  • Outline-Fonts / Vektor–Fonts

    Darstellung der Zeichen durch Umrisslinien bezeichnet die Vektorfont 3
  • Serifen–Fonts / Serifenlose Fonts

    Kennzeichnend ist die Serife 4, einen feine Linie als Abschluss des Buchstabenstrichs quer zu seiner Grundrichtung
  • „Hinted“–Fonts / „Unhinted“–Fonts

    Outline– / Vektor–Fonts nutzen mathematische Operationen zur Berechnung ihrer Umrisslinien. Letztendlich werden diese Umrisslinien aber bei der Ausgabe in Pixel umgesetzt, egal ob Bildschirmausgabe oder Druck. Dieser Vorgang wird als Rasterung bezeichnet (engl. „Rasterization“). Um die Darstellungsqualität von Text bei der Bildschirmausgabe zu verbessern, werden mathematische Optimierungsalgorithmen verwendet. Dies wirkt sich insbesondere bei kleinen Schriftgrößen aus. Diese Algorithmen sind Bestandteil des Fonts. Schriften, die solche Optimierungen nicht beinhalten, nennt man „unhinted“. „Hinting“ gibt es bei PostScript Type1– , OpenType– und TrueType-Fonts.
  • „Bounded“-Encoding / Unicode–Encoding

    Eine Schrift beinhaltet neben den darstellbaren Zeichen („Glyphen“) auch Identifikationen der Zeichen. Diese Identifikation setzt sich zusammen aus einem Tabellenplatz in einer „Codepage“ und einem eindeutigen Namen. Um IT-technisch die Zeichen einer Schrift zu adressieren, wird dem Zeichen ein eindeutiger Tabellenplatz in der „Codepage“ zugewiesen.

    Es gibt eine Vielzahl von plattform-, länder- und anwendungsspezifischen Tabellen – „Codepages“. Diese werden insbesondere in der AFP-Architektur verwendet. Solches „Encoding“ nennt man „Bounded“. Im Gegensatz dazu wird heutzutage immer mehr ein Unicode-Encoding verwendet. Unicode stellt eine große Tabelle dar, in der alle Zeichen einen Tabellenplatz zugewiesen bekommen. Diese Tabelle beinhaltet zur Zeit 112.956 Zeichen. Neben den uns bekannten alphanumerischen Zeichen sind alle möglichen Zeichen der Schriftsprachen dieser Welt enthalten, von Arabisch über die Vielzahl der asiatischen Schriftsprachen bis hin zu den ägyptischen Hieroglyphen. Um diese Zeichen für die EDV-Nutzung umzusetzen, werden „Universal Character Sets“ verwendet, die mit Hilfe von „Universal Character Set Transformation Format“ (UTF8, UTF16 oder UTF32) diese in hexadezimale Darstellung transformieren.
  • Kerning / Unterschneiden

    Verringerung des Zeichenabstands zur optischen Verbesserung
  • Ligaturen

    Kombinieren von Zeichen zur opischen Verbesserung AE  >  Æ
  • Kapitälchen

    Verkleinerte Großbuchstaben zur Texthervorhebung