Im letzten Beitrag habe ich erklärt, wie moderne Programmiersprachen grundlegend aufgebaut sind und durch welche Strukturen sie als Aufsatz auf Assembler das Programmieren erleichtern können. Beim Hantieren mit den Variablen im Beitrag sollte aufgefallen sein, dass ich stillschweigend und implizit davon ausgegangen bin, dass jede Variable eine ganze Zahl repräsentiert. Für die Grundlagen reicht das, bei komplexeren Programmen benötigt man jedoch einen etwas differenzierteren Mechanismus – und um den soll es heute gehen.
Bisher haben wir bereits betrachtet, wie Computer mit natürlichen, ganzen und reellen Zahlen rechnen können. In der Mathematik stellen diese Zahlenbereiche Mengen dar, also Sammlungen von Elementen, wobei eine Variable einem beliebigen Wert aus so einer Menge entsprechen kann. In der Informatik bezeichnet man eine solche Menge als Datentyp und die Elemente der Menge als Objekte (eine 1 ist also ein Objekt – seltsam, aber wahr). Mathematisch gesehen sind die Mengen der natürlichen, ganzen und reellen Zahlen zwar unendlich groß, aber auf Grund der Darstellung im Computer als Bitkette haben wir in der Informatik wie bereits besprochen einen begrenzten Zahlenraum.
Nun kann man mit Bitketten natürlich noch viel mehr als einfache Zahlen darstellen. Das erste, was jedem auffällt, der zum Beispiel diesen Artikel hier liest, ist, dass Computer augenscheinlich doch mehr als Zahlen speichern können, mindestens nämlich noch Buchstaben. Neben den Zahlen haben wir also einen weiteren Datentyp: Buchstaben oder Schriftzeichen, im englischen als Characters bezeichnet. Die Darstellung ist hier ziemlich einfach: eine Folge von zumeist 8 Bit (1 Byte) wird als ein konkretes Zeichen interpretiert, wobei die Interpretation meist dem sogenannten ASCII-Standard folgt (der eigentlich nur 7 Bit verwendet). So entspricht etwa die Bitkette 010000112 = 6710 dem großen C; mit 7 Bit können 128 Zeichen dargestellt werden, was für das lateinische Alphabet in Groß- und Kleinschreibung, die Zahlen, Operatoren und einige Sonderzeichen wie Zeilenende und ähnliches locker ausreicht (wer sich jetzt fragt, wie damit zum Beispiel das chinesische Alphabet abgebildet wird, der möge sich über Unicode informieren – vielleicht mache ich aber dazu auch noch irgendwann einmal einen Beitrag).
Nur allein mit Zeichen kommt man natürlich nicht weit: man muss sie auch zu Wörtern und Sätzen, sogenannten Zeichenketten oder englisch Strings, verbinden können. Auch das ist nicht kompliziert, wenn im Speicher einfach mehrere Bytes hintereinander angeordnet werden. Zusätzlich muss dem Computer nun natürlich noch mitgeteilt werden, wie lang die Zeichenkette ist – das geschieht entweder über die Angabe der Länge als natürliche Zahl vor der Bitkette im Speicher oder durch die Verwendung eines besonderen Abschluss-Bytes am Ende der Bitkette.
Nun fehlt eigentlich nur noch ein wichtiger Datentyp, und zwar der elementarste von allen; ich habe ihn bisher bereits in praktisch jedem Artikel verwendet, ohne ihn explizit zu erwähnen: die Wahrheitswerte. Dieser Datentyp umfasst die beiden Werte wahr (engl. true) und false (engl. false) und ist, wie wir bereits gesehen haben, für das Rechnen im Computer elementar; aber auch beim Programmieren wird er benötigt, zum Beispiel als Wert einer Bedingung in einer Schleife oder Verzweigung; in der Informatik werden Werte dieses Datentyps oft als boolesche Werte bezeichnet (nach dem Mathematiker George Boole, einem englischen Mathemiker und dem Erfinder des ersten Logikkalküls).
Hier noch einmal eine Übersicht über alle bisher genannten Datentypen:
Datentyp | Bezeichnung in der Informatik |
---|---|
natürliche Zahlen | Natural (N) |
ganze Zahlen | Integer (Z) |
Gleitkommazahlen | Real (R) |
Zeichen | Character (Char) |
Zeichenketten | String (S) |
Wahrheitswerte | Boolean (B) |
Nun kann man schon allein mit diesen Datentypen recht viele Dinge machen, da sie die Grundlage für jegliche Operation bilden – man spricht daher auch von primitiven Datentypen. Zur Lösung komplexerer Probleme benötigt man jedoch immer noch ein paar Typen zusätzlich, um sie vernünftig lösen zu können. Und hier kommen die zusammengesetzten Datentypen ins Spiel; wie ihr Name schon sagt, setzen sie sich aus anderen Datentypen (entweder primitive oder selbst zusammengesetzte) zusammen. Zwei dieser Strukturen werden besonders häufig verwendet: das Feld (englisch Array) und der Verbund (häufig als Record oder Structure bezeichnet).
Kommentare (7)