Wir Journalisten neigen ja manchmal zum Pathos. Vor allem, wenn es um ausdrucksstarke Umschreibungen der DNS geht. Das Buch des Lebens zum Beispiel oder der Lebenscode oder was es sonst noch so in dieser Kategorie gibt. Wenn man das im Hinterkopf behält, versteht man vielleicht, wieso ich kürzlich fasziniert Miguel zusah, der am Nebentisch in einem Textverarbeitungsprogramm Textzeilen markierte und simples “copy und paste” betrieb.
Bei geneuerem Hinsehen entpuppten sich die Textzeilen als eben dieser “Lebenscode”. Buchstabenblöcke, zusammengesetzt aus lückenlosen Reihen (ohne Leerzeichen würde ich als Journalist sagen) aus den vier Buchstaben A, T, G, C, die für die vier Basen Adenin, Thymin, Guanin und Cytosin stehen. Sie sind die Grundbausteine dieses sagenumwobenen Codes des Lebens (Pathos, ich sprach davon).
Und Miguel schnipselte einfach darin herum als wär es eine Liste bedeutungsloser Textzeilen.
Mann, der Text des Lebens, aus dem das alles, was hier so kreucht und fleucht auf unserem wunderbaren, blauen Planeten, hervorgeht. Der erst ermöglicht, dass auf dieser einsamen Insel in der Unendlichkeit des Weltalls, voll das pralle Leben haust in all seiner Vielfalt und Herrlichkeit. Entstanden in dreieinhalb Milliarden Jahren.
Einfach markieren, kopieren, und ins Bestellformular einfügen. Ein paar Tage warten und schon sind die ausgewählten DNS-Stücke da.
Bei der Auswahl Miguels war natürlich jeder einzelne Buchstabe wichtig. Die scheinbar zufällige Aneinanderreihung der Buchstaben war ein Ausschnitt aus einem Gen (und seiner nächsten Umgebung) für das Motorprotein pk l1. Miguel möchte herausfinden, welche Funktionen dieses Protein genau erfüllt. Dazu will er Hefezellen züchten, die dieses Protein nicht herstellen, um herauszufinden, was dann passiert. Deshalb muss er eine Zelllinie züchten, in der das Gen pk l1 für das Protein PK L1 fehlt.
Das Gen pk l1liegt auf dem ersten der drei Chromosomen der Spalthefezellen. Das weiß man so genau, weil seit 2002 das gesamte Genom von Schizosaccharomyces pombe bekannt ist. Es war der sechste Organismus, der zu den Eukaryonten zählt (deren Zellen also einen Zellkern, eine Zellmembran und mehrer Chromosomen besitzen), dessen Genom vollständig entziffert wurde: nach der Bäckerhefe (auch als Bierhefe bekannt) Saccharomyces cerevisiae (1996), dem Fadenwurm Caenorhabditis elegans (1998), der Taufliege Drosophila melanogaster (2000), der Ackerschmalwand Arabidopsis thaliana (2000) und dem Menschen Homo sapiens (2001).
Im unteren Bild ist ein Genombrowser zu sehen, der einem genau zeigt, auf welchem Chromosom an welcher Stelle ein Gen zu finden ist (Bild durch anklicken vergrößern). Ganz oben, die grau hinterlegte Skala ist eine Art Längenmaßstab des Chromosom 1. Der rote Strich zwischen 3M und 4M bezeichnet die genaue Lage des Gens pk l1 auf dem Chromosom. M bedeutet Megabasen, 3 M also 3 Millionen Basenpaare. Das Gen, um das es Miguel geht, liegt also zwischen 3 und 4 Millionen Basenpaaren.
Die genaue Lage des Gens erkennt man darunter. Erneut gibt es einen “Zahlenstrahl”, der den Bereich anzeigt, in dem das Gen liegt, also etwa im Bereich zwischen 3439 Kilobasen (oder 3,439 Megabasen oder 3.439.000 Basenpaaren) und 3442 Kilobasen. Das heißt, das Gen ist etwa 3000 Basenpaare lang.
Den groben Aufbau des Gens selbst stellt übrigens der dreiteilige rote, waagrechte Strich unterhalb des mittleren Zahlenstrahls dar.
Ein Ausschnitt aus diesem Gen ist in der Basensequenz im obersten Bild in gelb dargestellt. Kopiert hat Miguel das grün markierte Stück, von dem es noch ein zweites Stück am anderen Ende dieses Gens gibt (im Bild nicht zu sehen). Dies sind so genannte Primer, eine Art Erkennungszeichen (ein Start und Stoppzeichen), das den Anfang und das Ende des Gens markiert. Bestimmte Proteine, so genannte Polymerasen, benötigen diese Start- und Stoppzeichen, damit sie wissen, wo sie mit dem Aufbau einer Basensequenz (also z.B. einem Gen) beginnen müssen.
Diese Sequenzstückchen kopiert Miguel und fügt sie zum Beispiel in ein solches Online-Formular ein (in das Feld Primer Sequence 5′ to 3′):
Nach einigen Tagen bekommt er genau diese Sequenzstücke in farblosen Tropfen in kleinen Plastikröhrchen zurück.
Dann kann er mit der eigentlichen Arbeit beginnen …
(… aber da ist eine andere Geschichte, Stichwort hier ist https://de.wikipedia.org/wiki/PCR).
So profan kann das Arbeiten mit der Code des Lebens sein. Einfach markieren, kopieren, bestellen und dann damit arbeiten. Dass das möglich wurde und auch noch so einfach ist, dafür haben einige Leute eine Menge Nobelpreise gekürte Forschung betrieben (müsste man mal auflisten … wo fängt man da an? … bei Watson und Crick? … dann Mullis … )
Aber so ist das ja oft: Den einfachen Dingen sieht man meist nicht an, wie viel Arbeit in Ihnen steckt.
Dieser tolle, so einfache, wunderschöne Code …
Eine Liste der mehr als 180 Organismen, deren Genom seit 1995 sequenziert wurden findet sich hier.
Bilder: Screenshot Tolic Lab (2), Screenshot Invitrogen
Kommentare (4)