Aus aktuellem Anlaß (Darwins 200. Geburtstag): Mathematik für die Suche nach Stammbäumen.
Das Bild oben zeigt den Stammbaum des Menschen nach Ernst Haeckel.
“Stammbäume” spielen auch heute noch eine Rolle in der Biologie, allerdings auf einer anderen Ebene als bei Haeckel. (Vgl. Wikipedia: “The model is still considered valid for eukaryotic life forms. The earliest branch of the eukaryote tree yields four supergroups: Plants, Unikonts, Excavates, and SAR. Modern biologists now recognize, however, that the prokaryotes, the bacteria, have the ability to transfer genetic information between unrelated organisms. Recombination, gene loss, duplication, and gene creation are a few of the processes by which genes can be transferred within and between bacterial species, causing variation that’s not due to vertical transfer. The tree of life gives an incomplete picture of life at this level.”)
Einen interessanten Artikel über mathematische Aspekte von Evolutionsbäumen gab es letztes Jahr hier im plus-Magazin.
Ein (mathematischer) Baum besteht aus:
– Ecken (hier: die Arten) und und es soll keine Kreise geben (eine Art soll nicht gleichzeitig Vorfahre und Nachkomme einer anderen sein). |
Die Mathematik liefert Algorithmen zur Bestimmung eines Evolutions-Baumes aus beobachteten Daten.
Man will z.B. einen Baum erstellen, der die Mutationen von Genen beschreibt. Der Baum besteht dann wieder aus:
– Ecken (Gene) – Kanten (zwei Gene sind durch eine Kante verbunden, wenn das eine durch Mutation aus dem anderen hervorgeht). |
Ein Beispiel aus dem verlinkten Artikel: Zu je zwei Mutationen eines Gens kann man experimentell ihren ‘Abstand’ bestimmen, also wieviele ‘Buchstaben’ in der Folge von A,C,G,T’s sich unterscheiden.
Das mathematische Problem besteht jetzt in der Suche nach einem Baum, in dem die Mutationen dann gerade diese Abstände haben. (Und in der Frage, ob dieser Baum eindeutig bestimmt ist.)
Für die Suche nach solchen Bäumen gibt es verschiedene Algorithmen, oft verwendet wird z.B. der Neighbor-Joining-Algorithmus:
Ausgehend von einem zunächst sternförmigen “Baum”, in dem alle Taxa mit einem “Zentrum” verbunden sind, werden paarweise die DNA- oder Proteinsequenzen mit der geringsten genetischen Distanz ausgewählt und zu einem Ast des Baumes vereinigt. Die genetischen Distanzen der Sequenzen werden neu berechnet und wieder die nächstverwandten zu einem Ast mit zwei Taxa zusammengefügt. Dies erfolgt solange, bis alle Taxa in dem Baum eingefügt wurden und die Sternstruktur des Baumes völlig aufgelöst wurde.
Es gibt noch eine Reihe anderer Algorithmen, etwa den UPGMA-Algorithmus, deren Vor- und Nachteile im Einzelnen zu erörtern mir hier die Zeit und Kompetenz fehlt.
Ich möchte bei der Gelegenheit aber noch auf das Tree of Life – Projekt hinweisen, eine Sammlung von mehr als 10000 Webseiten zur Phylogenese. |
Kommentare (1)