<?xml version=”1.0″ encoding=”utf-8″ standalone=”yes”?>
Das ist die Kopfzeile eines XML-Dokuments, also einer Datei deren Inhalt mit der Beschreibungssprache XML beschrieben wird. Der hervorgehobene Teil, encoding=”utf-8″, teilt dem verarbeitenden Programm mit, das der Text mit UTF-8 codiert ist. Das bedeutet, dass die meissten Zeichen 8-Bit breit sind. Wenn die Zeichencodes Werte zwischen Null und 127 haben, sind sie mit dem 7-Bit breiten ASCII-Code identisch. Wenn ein Codebyte mit einem Wert grösser als 127 folgt, ist das ein Kennzeichen dafür, dass das nächste Zeichen durch mehrere Bytes definiert ist, deren Zahlenwert auch jeweils grösser als 128 ist. Dabei sind zwei bis vier Bytes möglich, aber die Details spar ich mir hier. Nur noch soviel: neben UTF-8 sind noch UTF-16 und UTF-32 verbreitet, wobei die Zahl angibt, mit wievielen Bits ein Zeichen kodiert ist. (Technisch interessierte könnte in disem Zusammenhang auch das RFC 4042 gefallen, welches UTF-9 und UTF-18 beschreibt. Zu beachten ist dabei auch das Erscheinungsdatum der Publikation!)
Jetzt noch kurz wieder zur Zeichendarstellung auf dem Bildschirm. Was bei den 16-Bit Heimcomputern (Amiga & Atari ST) seit 1986 normal war, wurde dann ab Windows 3.0 auch auf dem (IBM oder kompatiblen) PC so langsam zur Normalität, nämlich eine grafische Benutzeroberfläche, englisch: Graphical User Interface, kurz GUI. Davon gab es neben Windows 3.x auch noch andere, wovon GEM die bekannteste sein dürfte, gefolgt vom OS/2 Presentation Manager und PC-Geos. Alle diese Oberflächen haben die Gemeinsamkeit, dass sie den PC dauerhaft in den Grafikmodus schalten. Deshalb heissen sie ja auch so. Und wie oben schon erwähnt, sind dadurch auch lesbare Texte im inneren des Rechners nichts anderes als grafische Darstellungen. Das ermöglichte es schliesslich, Software zu entwickeln, die das, was sie auf dem Drucker ausgab, zuvor auch genauso auf dem Bildschirm anzeigte. Im Fall der Textverarbeitung war es damit endlich möglich, einen Text auch so am Bildschirm anzuzeigen, wie er auch aus dem Drucker heraus kommen würde. Auszeichnungen, wie fett, kursiv oder unterstrichen konnten endlich am Bildschirm sichtbar gemacht werden, auch alle miteinander kombiniert. Dazu kam als weiterer Vorteil, dass man auch verschiedene Zeichensätze verwenden konnte, und auch die Schriftgrösse endlich variabel war. Diese ganze Entwicklung lief unter dem Stichwort “WYSIWYG”. Diese Wortschöpfung ist die Abkürzung für What You See Is What You Get, also Was Du (am Bildschirm) siehst, ist das, was Du (aus dem Drucker) heraus bekommst.
Um das zu ermöglichen kam man mit den oben gezeigten “Pixelzeichensätzen” natürlich nicht mehr aus. Wenn man die vergrössert, dann werden die Zeichen irgendwann eckig und/oder Treppenförmig. Das kann man z.B. an den beiden Zeichematrizen des Buchstaben “A” sehr schön sehen, die ich oben zeige. Denn die sind ja sehr stark vergrössert. Um diese Treppenformen zu vermeiden, und einen Bogen bei jeder beliebigen Vergrösserung auch noch wie einen Bogen aussehen zu lassen, hat man sogenannte Vektorzeichensätze eingeführt. Bei diesen Zeichensätzen, werden die Zeichen nicht mehr durch einzelne Punkte definiert, sondern mathematisch durch Kurven beschrieben. Es ist dann Aufgabe der Nutzeroberfläche, ein Zeichen entsprechend einiger Vorgaben auf dem Bildschirm darzustellen. D.h. wenn die Nutzeroberfläche den Code für ein darzustellendes Zeichen bekommt, dann braucht sie weitere Informationen, wie Grösse, Zeichensatz, gewünschte Auszeichnungen, die näher beschreiben, wie das Zeichen dazustellen ist. Aus diesen Informationen berechnet sie dann, welche Pixel der nächsten zu bedruckenden Fläche die gewünschte Schriftfarbe bekommen und welche die Farbe des Hintergrundes behalten.
Soweit mal dieser Ausflung in die Welt der Codierungen und Zeichendarstellungen, ohne die die ganze EDV, die wir hier nutzen, nicht möglich wäre. Auf weitere Entwicklungen bei Textverarbeitungen, die ich ursprünglich vorgesehen hatte, gehe ich nicht mehr näher ein, weil ich zum einen die 20.000 Zeichen Marke schon längst überschritten habe und es zum anderen auch zeitlich nicht mehr hinbekomme. Das Zusammensuchen einiger Informationen und erstellen der oben gezeigten Bilder hat zum Teil mehr Zeit gekostet, als ich erwartet habe.
Kommentare (46)