Meine erstes Thema wird die Ausbreitung von Mutationen innerhalb einer finiten Population sein.

Motoo Kimura entwickelte seine Theorie dazu in den 1960er bis 1980er Jahren ausgehend von Anwendungen von Diffusions Approximationen auf genetische Fragestellungen, an denen zuvor R.A.Fisher und S. Wright gearbeitet hatten. Die Herleitung der Formeln übersteigt dabei mein mathematisches Verständnis. Die Theorie (und ihre nahezu neutrale Erweiterung) ist aber eine der elegantesten in der Biologie und daher auch intuitiv verständlich.


Ich versuche deshalb nur ihre Grundzüge ohne Anspruch auf Vollständigkeit darzustellen, zu zeigen welche Annahmen benötigt werden und welche Vorhersagen dies erlaubt. Bewusst wähle ich diesen Ansatz mit einer der mathematisch komplexesten Theorien zu starten (in den folgenden Posts kann es also nur einfacher werden) und werde später bei mathematisch einfacheren Theorien mehr auf Herleitung und Entwicklung der Formeln eingehen.

Hauptsächlich interessiert mich im aktuellen Post die Fixierungswahrschheinichkeit eines Allels (Ausprägungszustand eines Gens), oder spezieller einer neuen Mutation. Fixierung bedeutet hierbei, dass in der Population ausschließlich das betreffende Allel vorkommt. Der Verlust des Alles oder dessen Fixierung stellen Extremzustände da, die sich in einer vereinfachten Darstellung untersuchen lassen.
Hartl und Clark benutzen das Beispiel einer Bowling-Bahn in der die seitlichen Rinnen Analoga dieser Extremzustände sind. Nimmt man nun an, dass die -analog zur Zeit- unendlich lange Bahn -analog zu möglichen Zufallsereignissen- nicht perfekt eben ist- wird offensichtlich, dass jedes Allel über kurz oder lang einen dieser Extremzustände erreicht.
Wichtig ist lediglich die Breite der Bahn oder ihr biologisches Analogon, die Populationsgröße.

Wir nehmen eine diploide Population mit N Individuen an, in dieser sind 2N Kopie des interessierenden Gens vorhanden und es werden 2N Gameten für die nächste Generation gewählt , die dann wieder N Zygoten bilden (=gleichbleibende Populationsgröße und zufällige Paarung). Die Fixierunswahrscheinlickeit eines Alles ist nun gegeben durch seine aktuelle Frequenz p0/Anzahl der Kopien. Im Falle einer neuen Mutation, die per Definition nur einmal vorhanden ist

i-55df2e11bd6cd760e5a7a5b7398a21b9-neu1_f.jpg

[1]

Das macht Intuitiv Sinn, da jedes Gen einen Fixierungszustand ansteuert und zum Startzeitpunkt eben 2N Alternativen gegeben sind.

i-0fec6467fa66231666b317a0917bea0e-neutral.jpg

{1}

Betrachtet man die aus dieser Formel resultierende Fixierungswahrscheinlichkeit für eine Mutation als Funktion der Populationsgröße wird deutlich, dass diese Wahrscheinlichkeit selbst für eine moderate Populationsgröße nicht besonders groß ist. Sie ist allerdings auch nicht 0 für große Populationen (z.B. N=1,000,000-> p= 0,0000005)

u ist die Mutationsrate mit der irgendwo im interessierenden Abschnitt des Genoms eine Mutation entsteht. Neutralität kann man nun für einen ganzen Abschnitt des Genoms, wie z.B. ein Pseudogen, annehmen oder für spezielle Mutationen, wie z.B. jene von degernerierte Basen an der dritten Stelle eines Kodons (= synonyme Mutationen).
Die Rate u, mit der die Mutationen entstehen ist nun erstaunlicherweise gleich der Rate mit der neutrale Mutationen fixiert werden K. Sie ist unabhängig von der Populationsgröße, da in großen Populationen auch mehr Mutationen entstehen.

i-c6a8a124273bb1144b927bcae7bd1d64-neu_f.jpg

[2]

d.h. die kleinere Fixierungswahrscheinlichkeit und die Populationsgröße heben sich gegenseitig auf. Ein Zusammenhang von mathematisch schlichter Schönheit.
Die durchschnittliche Zeit zwischen zwei Fixierungen ist dann logischerweise 1/u.

Dieses Modell passt logischerweise nicht immer zu den beobachteten Daten und ist daher sehr hilfreich als Nullhypothese um Neutralität zu testen. Es ist allerdings falsch aus abweichenden Beobachtungen auf Nicht-Neutralität zu schließen, da auch andere Voraussetzungen wie beispielsweise die gleichbleibende Populationsgröße verletzt sein können.

Folgerungen aus der neutralen Theorie der molekularen Evolution tauchen in zukünftigen Post wieder auf. In diesen werde ich näher auf den Einfluss von Selektion und damit auf die nahezu neutrale Version der Theorie eingehen, finite Populationsgrößen näher beleuchten und Zusammenhänge von Polymorphismus und Divergenz aufzeigen.

Kommentare (7)

  1. #1 Engywuck
    März 16, 2009

    Interessanter Zusammenhang…

    Gibt es irgendwo eine Seite, wo die Herleitung etwas mathematischer als hier (aber nicht nur in Formeln) steht?

    Für alle, die wie ich zuerst über den Schritt zu K=u gestolpert sind: 2*N ist ja die Zahl der Gameten, u die Mutationsrate *pro Gamete*, also entstehen pro Generation 2*N*u Mutationen, die mit 1/(2*N) Wahrscheinlichkeit fixiert werden.

    Ich liebe es, dass wesentliche Punkte der Natur sich so mathematisch “primitiv” beschreiben lassen… da könnte man fast zum Anhänger des ID werden, allerdings mit einem Mathematiker als Gott 😀

  2. #2 Emanuel Heitlinger
    März 16, 2009

    Danke! Das war vielleicht nicht ganz klar formuliert…

    Es gibt nature scitables zu dem thema , auf die werd ich auch nochmal in nem Zusammenfassungspost verlinken. Da ist das aber alles weniger detailliert, als ich das hier vorhab.

    Meinst du eigentlich mit

    Gibt es irgendwo eine Seite, wo die Herleitung etwas mathematischer als hier (aber nicht nur in Formeln) steht?

    wie man von der Gleichung für genetic drift (die kommt von Binominalverteilung, die die Wahrscheinlichkeit eine bestimmte Allelfrequenz in der nächsten Generation zu haben bestimmt) auf die diffusion approximations und dann zu den 4Ne in den weiteren Gleichungen (nächster Post) kommt.

    Für 1/2N braucht man ja so wie ich das seher keine Herleiitung…

  3. #3 Engywuck
    März 16, 2009

    damit meinte ich nicht ganz so “mathematisch” wie das manche Profs bei uns damals in bestimmten Bereichen der Theoretischen Physik gemacht haben (3000 Formeln in 45 Minuten, daziwschen noch ein paar “also”, “daraus folgt”, etc) sondern hmmmm… meinetwegen so wie Einstein in seinen berühmten Aufsätzen 1905 – viel Text, aber alles sauber nachvollziehbar ohne 300 Semester höhere Mathematik gehabt zu haben.

    Ja, 1/(2N) macht intuitiv Sinn – auch wenn ich zuerst gedacht hätte, es müsse 1/(4N) sein, da ja 2N Gameten und damit Kopien bestehen und es zwei Varianten gibt – bleibt erhalten oder nicht. Dann ist mir aber aufgefallen, dass die Mutation um sich durchzusetzen ja auf beiden Kopien jedes Individuums vorhanden sein muss… 😀

    Den Link werde ich mir die Tage mal zu Gemüte führen – grad hab ich keine Lust auf Wissenschafts-Englisch in einem mir fremden Fachbereich 🙂

  4. #4 Emanuel Heitlinger
    März 16, 2009

    Ich werde noch
    1.die restlichen bisherigen Posts der Serie von meinem alten Blog hier rüberschaffen.
    Dann
    2. schreib ich n bischen was über die Herleitung der etwas komplizierteren Formeln der Theorie. Allerdings steht darüber in den beiden sehr guten Büchern, die ich benutze nur : “Analysisi of the Diffusion Approximation has shown”… so ähnlich haben wir das auch in der Vorlesung zu hören bekommen. Kann sein dass ich das einfach nicht schaffen werde…
    3. gibts dann noch nen Zusammenfassungspost zu dem “Neutrale Theorie Thema” .
    Und dann fang ich
    4. mal die ganze Savhe richtig von vorne an, mit den einfachen Zusammenhängen… da kann ich dann die Herleitungen lückenlos zeigen und auch noch was sinnvolles dazu schreiben

    Über feedback ob das dann zu mathematisch ist freu ich mich!

  5. #5 Joe Dramiga
    Januar 1, 2010

    Hallo Emmanuel!

    Zum Neuen Jahr eine aktuelle Arbeit der Forschungsgruppe von Prof. Weigel am MPI für Entwicklungsbiologie in Tübingen, die dich vielleicht interessieren wird.
    Weigel und seine Mitarbeiter maßen die Geschwindigkeit von Mutationen, bevor die Selektion eingreift. Dafür sequenzierten sie die Genome von fünf Linien der Ackerschmalwand Arabidopsis thaliana über 30 Generationen hinweg. Im Erbgut der letzten Generation untersuchten sie dann, welche Unterschiede in der DNA-Sequenz sich im Vergleich mit den Ausgangspflanzen ergeben hatten.

    http://www.mpg.de/bilderBerichteDokumente/dokumentation/pressemitteilungen/2009/pressemitteilung20091223/index.html

    Detlef Weigel, Stephan Ossowski, Korbinian Schneeberger, Norman Warthmann, Richard M. Clark, José Ignacio Lucas-Lledó, Michael Lynch, Ruth G. Shaw
    The rate and molecular spectrum of spontaneous mutations in Arabidopsis thaliana
    Science, 1. Januar 2010

  6. #6 Alexander
    Januar 2, 2010

    Joe,

    ich klink mich mal da ein, auch wenn der Kommentar an Emanuel gerichtet ist. Mir ist das neue Paper von Detlef Weigel auch schon untergekommen, hatte aber noch keine Zeit es zu lesen. Ich hatte aber auch schon überlegt was darüber zu schreiben.
    Ich hab auch schon mehr als einmal Dienste und Daten von Weigel benutzt, und das hier hört sich echt klasse an. Es ist echt erstaunlich, was Stefan Ossowski in den letzten Monaten als Erstautor veröffentlicht hat, Hut ab!

  7. #7 Emanuel Heitlinger
    Januar 9, 2010

    Hi Joe,
    danke für den Tip, ist ein interessantes Paper!
    Du erinnerst mich mit dem Kommentar zu diesem Post auch daran, dass ich die Popgen-serie weiter machen sollte.
    Ich werd allerdings diesmal wirklich mit den Grundlagen anfangen, Hardy-Weinberg etc…

    Ein vergleichbares Paper in Drosophila ist übrigens dies hier:
    http://genome.cshlp.org/content/19/7/1195

    Aus beiden zusammen könnte man gut einen Geschwindigkeits-Post machen… ich werd allerdings din den nächsten Wochen wahrscheinlich nicht dazu kommen.