In der letzten Folge haben wir gesehen, wie man zahlreiche STR-Systeme gleichzeitig mittels Multiplex-PCR vervielfältigt und dabei farblich markiert, um das dabei entstehende Gemisch von DNA-Fragmenten hinterher kapillarelektrophoretisch ordnen und analysieren zu können. Das Endergebnis ist ein DNA-Profil das aus den Angaben „STR-System” und Allel(kombination) besteht und das, so habe ich behauptet, nur einmal auf der Welt vorkommt.

In dieser Folge erkläre ich, warum und wie man berechnen kann, wie selten so ein DNA-Profil ist und ich beweise, daß meine Behauptung stimmt.


Bevor wir aber mit dem DNA-Profil selbst loslegen, müssen wir noch einige Grundlagen erarbeiten:

1. Wahrscheinlichkeit von Ereignissen
Die Wahrscheinlichkeit, daß ein Ereignis eintritt, hat einen Wert zwischen 0 und 1, wobei 0 für eine 0%- und 1 für eine 100%-Wahrscheinlichkeit steht. 0 und 1 sind die Absolutwerte, d.h. ein Ereignis mit Wahrscheinlichkeit 0 bzw. 1 wird niemals bzw. sicher eintreten.
Welche Wahrscheinlichkeit aber nun das Eintreten eines bestimmten Ereignisses hat, hängt vollständig davon ab, in welcher Umgebung des Ereignis auftreten kann und unter welchen Bedingungen.
Nehmen wir als Beispiel den 6-seitigen, ungezinkten Würfel. Wenn wir ihn werfen, hat das Ereignis E1, daß eine 1,2,3,4,5 oder 6 fällt, eine Wahrscheinlichkeit von 1 und das Ereignis E0, daß keine dieser Zahlen gewürfelt wird, eine Wahrscheinlichkeit von 0. Beide Ereignisse schließen sich aus, es kann nur das eine oder das andere eintreten, nicht beide zusammen oder eine „Schnittmenge” von beiden.
Die Wahrscheinlichkeit, daß eine „1″ fällt, ist genauso hoch, wie daß irgendeine andere Zahl fällt. Bei sechs Möglichkeiten und einer gleichmäßigen Verteilung der Wahrscheinlichkeiten auf alle Möglichkeiten also E1 : 6 = 1/6 = 0,1666666.
Wie wahrscheinlich ist es aber, daß, wenn man einen zweiten, gleichartigen Würfel hinzunimmt und beide gleichzeitig wirft, beide Würfel eine „1″ zeigen? Für jeden einzelnen Würfel gilt natürlich das eben ermittelte: eine „1″ tritt mit einer Wahrscheinlichkeit von 1/6 auf. Da sich aber die beiden Würfel gegenseitig nicht beeinflussen können, also unabhängig voneinander sind, wird nur in einem von sechs Fällen, in denen ein Würfel eine „1″ zeigt, auch beim anderen eine „1″ fallen. Also 1/6 von 1/6. Das ist 1/36 (= 1/6 x 1/6) von einem Ganzen. Kurz: das gleichzeitige Eintreten von zwei unabhängigen Ereignissen ist so wahrscheinlich, wie das Produkt der Einzelwahrscheinlichkeiten beider Ereignisse.

2. Vererbung von Merkmalen nach Mendel
Ein Mensch besitzt 23 Chromosomenpaare. 22 Autosomen- und ein Geschlechtschromosomenpaar (Frau: XX, Mann: XY). Bis auf die Geschlechtschromosomen beim Mann sind die Partner eines Paares gleich (nicht identisch), indem sie die gleichen Gene in der gleichen Reihenfolge enthalten. D.h. jeder Mensch hat von jedem Gen bzw. von jedem DNA-Abschnitt, zwei Kopien: eine auf jedem Partner eines Chromosomenpaares. Diese Genkopien müssen sich aber nicht identisch gleichen, sie können kleine oder größere Abwandlungen haben und man nennt die Varianten eines Gens „Allel” (hier ist das ausführlicher beschrieben).
Das eine Allel wurde vom Vater, das andere von der Mutter vererbt, die beide selber jeweils zwei Allele dieses Gens besitzen. Welches der beiden Allele vererbt wird, bestimmt der Zufall, also liegt die Wahrscheinlichkeit, daß ein bestimmtes Allel vererbt wird, bei 0,5. Daß also ein Kind eine bestimmte Kombination von Allelen der Eltern erhält, hat eine Wahrscheinlichkeit von 0,25 (= 0,5 x 0,5) oder ¼, weil die Vererbung der Allele durch die Elternteile unabhängig voneinander verläuft.

i-29c55386513a84e4f6d56244e8c659ae-hwe01.jpg

Die Abbildung zeigt die Vererbung eines Merkmals, das vier mögliche Allele (A,B,C,D) hat. Der Vater hat die Allele A und B, die Mutter C und D. Deren Nachkommen haben immer eine Kombination aus einem väterlichen und einem mütterlichen Allel und alle vier möglichen Kombinationen sind gleich wahrscheinlich.
Genau so funktioniert auch die Vererbung der Allele von STR-Systemen. Jeder von uns besitzt für jedes STR-System zwei Allele, eins vom Vater eins von der Mutter.

3. Grundlagen der Populationsgenetik

„Die Populationsgenetik ist der Zweig der Genetik, der Vererbungsvorgänge innerhalb biologischer Populationen untersucht. Sie ermittelt die relative Häufigkeit homologer Gene (Allele) in Populationen (Genfrequenz) und erforscht deren Veränderung unter dem Einfluss von Mutation, Selektion, zufälliger Gendrift, der Separation von Teilpopulationen und dem Genfluss zwischen Populationen. Sie hat eine große Bedeutung in der Evolutionsforschung sowie in der Tier- und Pflanzenzucht.
Ein wichtiger Grundsatz der Populationsgenetik ist das schon 1908 von Wilhelm Weinberg und Godfrey Harold Hardy unabhängig entdeckte Hardy-Weinberg-Gesetz, das bei rein zufälliger Paarung und in Abwesenheit jeglicher Selektion einen Gleichgewichtszustand beschreibt, in dem die Häufigkeit der Allele eines Gens von Generation zu Generation konstant bleibt.” Wikipedia

Um etwas über die Seltenheit eines DNA-Profils, das sich ja aus einer Kombination von Allelkombinationen in z.B. 16 STR-Systemen zusammensetzt, aussagen zu können, müssen wir wissen, wie häufig die Allele aller getesteten STR-Systeme in der Bevölkerung auftreten.
Das geht nur empirisch, d.h., man muß eine ausreichend große Stichprobe (200+) aus der Gesamtbevölkerung ziehen und in dieser Stichprobe die Allelverteilung in diesen STR-Systemen messen. Unter bestimmten Bedingungen (die hier als gegeben vorausgesetzt werden dürfen) kann man dann die Allelverteilung in der Stichprobe auf die Gesamtbevölkerung übertragen. Dabei gilt dann: je häufiger ein bestimmtes Allel ist, desto wahrscheinlicher ist es, daß eine beliebige Person, die ich mir aussuche, genau dieses Allel besitzt.

Wie oben beschrieben, besitzt ein Mensch aber nicht nur ein sondern immer zwei Allele für jedes STR-System, eines auf jedem Chromosom eines Chromosomenpaares. Um also zu ermitteln, wie selten ein STR-Genotyp (der ja aus zwei Allelen besteht) ist, reicht es nicht, nur die Häufigkeit der Allele in der Population zu kennen, man muß auch berechnen, wie selten die Kombination genau dieser beiden Allele ist. Die mathematische Grundlage dafür sind die Gleichungen von Hardy und Weinberg, die besagen, daß in einer Population unter diversen Annahmen (die wir aber für die STR-Systeme als näherungsweise erfüllt ansehen dürfen) für ein Merkmal für die Häufigkeit der Genotypen folgendes gilt:

p2 + 2 pq + q2 = 1

 Dabei steht p für die Häufigkeit des Allels P und q für die Häufigkeit aller Allele, die nicht P sind (also 1-p = q).

Da wir die Häufigkeiten der Allele der STR-Systeme kennen, können wir nun die Häufigkeit jedes STR-Genotypen berechnen.

Beispiel: im STR-System „FGA“ besitzt ein Mensch die Allele 18 (p)  und 20 (q). Aus einer Tabelle entnimmt man die Häufigkeit der Allele: p = 0,0227 und q = 0,1629. Der Genotyp dieses Menschen ist heterozygot, also gemischterbig, er besteht aus zwei verschiedenen Allelen und daher hat diese Kombination eine Häufigkeit von 2 x p x q oder 2 x 0,0227 x 0,1629 = 0,00739566. Das entspricht einer Häufigkeit von 0,739566 % und bedeutet, daß nur ca. 0,7 % der Bevölkerung im FGA-System genau diese Allelkombination besitzt!

Ein weiteres Beispiel: ein anderer Mensch besitzt im STR-System „FGA“ nur das Allel 18 (p), weil er homozygot ist,  also reinerbig, d.h. auf beiden Chromosomen hat er dasselbe Allel. Dieser Genotyp hat die Häufigkeit p2 = p x p = 0,0227 x 0,0227 = 0,00051529. Das entspricht einer Häufigkeit von 0,051529%, womit dieser FGA-Genotyp sogar noch viel seltener wäre.

So, jetzt haben wir die Grundlagen, um zu verstehen, wie die kombinierte Häufigkeit eines forensischen DNA-Profils berechnet wird. Dazu noch folgende Anmerkungen/Voraussetzungen:

–         wir kennen die Häufigkeit jedes Allels aus jedem STR-System

–         die von uns verwendeten STR-Systeme werden nach den mendel’schen Regeln vererbt (wie unter 2. beschrieben)

–         die Vererbung eines Allels aus einem bestimmten STR-Systems beeinflusst in keiner Weise die Vererbung eines Allels aus irgendeinem anderen STR-System, sie werden also vollständig unabhängig voneinander vererbt

–         alle Allelkombinationen aller STR-Systeme sind evolutiv neutral, d.h., keine mögliche Allelkombination beeinflusst in irgendeiner Weise die Wahrscheinlichkeit, daß ein Individuum sich besser/schlechter fortpflanzt

Unter diesen Voraussetzungen kann man dann die kombinierte Häufigkeit eines DNA-Profils als Produkt der Einzelwahrscheinlichkeiten der Genotypen aller vom Profil umfassten STR-Systeme berechnen. Nehmen wir noch mal unser altes DNA-Profil her:

STR-System Allele von Person X

Häufigkeit der Allele

Häufigkeit des Genotyps

SE33

15,29.2

0,051 / 0,005

0,00051

D21S11

27

0,037

0,001369

vWA

16,20

0,214 / 0,0165

0,007062

TH01

9.3

0,3031

0,09186961

FGA

23,26

0,1439 / 0,0152

0,00437456

D3S1358

13,17

0,0071 / 0,2186

0,00310412

D8S1179

9

0,011

0,000121

D18S51

11,21

0,02 / 0,01

0,0004

 

Wenn man jetzt die Einzelhäufigkeiten der Genotypen multipliziert, kommt man auf eine Gesamthäufigkeit dieses Profils von 0,00000000000000000001, d.h. nur 0,000000000000000001% der Bevölkerung hat dieses Profil. In anderen Worten: dieses Profil würde bei weit (!) weniger als einer Person von 7.000.000.000 (= derzeitige Weltbevölkerung) zufällig noch einmal auftreten, womit man jenseits jeden vernünftigen Zweifels davon ausgehen darf, daß es einmalig auf der Welt (und sogar in der Menschheitsgeschichte) ist.

Wenn also beispielsweise ein solches DNA-Profil, das aus der Hautabriebspur an einer Mordwaffe erzeugt worden ist, voll übereinstimmt mit dem DNA-Profil eines Tatverdächtigen, so kann man sicher sein, daß diese Spur vom Tatverdächtigen stammt (hingegen nicht, daß er den Mord auch wirklich begangen hat!).

So. Und damit endet diese Serie, in deren Verlauf wir die Grundlagen und einzelnen Stufen eines forensischen Spurengutachtens kennengelernt haben:

Für das tiefere Verständnis gab es dazu noch folgende Basics-Artikel:

Danke und Respekt für alle, die bis hierhin durchgehalten haben.

flattr this!

Kommentare (14)

  1. #1 rolak
    27/10/2011

    Kann sein, daß ich eine Denkblockade habe, doch seit gestern nachmittag komme ich nicht auf den Punkt, der die H-W-Gleichungen derart genial macht, daß sie immerhin einen eigenen Namen verdienen. K=p²+2pq+q² ist selbstverständlich die Wahrscheinlichkeit für eine beliebige Kombination zweier unabhängiger Ereignisse der Wahrscheinlichkeit p bzw q – und für komplementäre Ereignisse p+q=1 ergibt sich spätestens durch stures Ausrechnen K=1.

    Oder geht es darum, festzulegen, wann diese schlichte Wahrscheinlichkeitsrechnung auf genetische Merkmale von Populationen angewendet werden darf?

  2. #2 Cornelius Courts
    27/10/2011

    @rolak: HWs eigentliche Leistung war, entgegen der damaligen Annahme, daß seltene Allele mit der Zeit aus einer Population verschwinden würden, zu zeigen, daß die Mendelschen Gesetze dieses Phänomen genau nicht vorhersagen.
    Stattdessen formulierten sie den bekannten Zusammenhang, mit dem man bei bekannten Allelfrequenzen die Genotypenhäufigkeiten (und vice versa) berechnen (und graphisch darstellen kann – https://finetti.meb.uni-bonn.de/ ).
    Das HW-Modell ist dabei ein “Null-Modell”, das unter den folgenden, idealisierten Bedingungen zutrifft:
    – diploider Organismus
    – sexuelle Reproduktion
    – nicht überlappende, diskrete Generationen
    – der betrachtete Locus hat zwei Allele
    – Allelfrequenzen sind gleich bei allen Paarungstypen (z.B. Geschlechter)
    – Paarung ist zufällig
    – Gametenvereinigung ist zufällig
    – Populationsgröße ist nahezu unendlich
    – vernachlässigbare Migration
    – keine Mutation
    – keine nat. Selektion
    Trotz all dieser EInschränkungen funktioniert das HW-Modell auch mit “echten” Populationen recht gut (und soll auch gar keine exakte Beschreibung solcher sein). Man vergleicht vielmehr echte Populationen mit dem Null-Modell, um Hypothesen über die evolutiven Einflüsse (wie Selektion, Drift, bottlenecks etc.), die auf die Population einwirken, zu testen.
    Kurz: HW haben gezeigt, daß der Prozess der partikulären Vererbung (nach Mendel) selbst KEINE Veränderung der Allelhäufigkeiten in einer Population bewirken kann. WENN dies also beobachtet wird, muß es auf einen anderen Einfluss zurückzuführen sein. Damit ist praktisch die Populationsgenetik begründet.
    Und Du weißt ja:

    “Nothing in Biology Makes Sense Except in the Light of Evolution” (Theodosius Dobzhansky)

    und

    “nothing in evolution makes sense except in the light of population genetics.”
    (Michael Lynch)

    😉

  3. #3 rolak
    27/10/2011

    Ah danke, damit ist der schon leicht gesunkene Groschen endgültig gefallen.

    Kleiner Gag am Rande: Für den Feuerfuchs mit seinem eigenen Zertifikatspeicher ist die arme Uni Bonn nicht vertrauenswürdig 🙂

    Oh, bevor ich es vergess: “Nothing will make sense if there ain’t one” (Keine Ahnung, ggfs ich 😉

  4. #4 Karl
    29/10/2011

    Ich sollte vielleicht ganz allgemein ausführen, dass Biologen einmal versuchen sollten, ihre Theorien mathematisch zu fassen. Neulich habe ich mal ein Biologie-Lehrbuch (den Alberts, scheint seriös zu sein!) zur Hand genommen und die Mathematik, die ich darin gefunden habe, war wirklich erbärmlich. Sie war nämlich de facto nicht vorhanden!

    Obwohl man konstatieren muss, dass neue systembiologische und bioinformatische Anforderungen dafür zu sorgen scheinen, dass zukünftige Biologengenerationen keine derartigen Mathophoben mehr sein können. Ich hoffe doch sehr, dass sich so langsam auch in der Biologie die Tatsache herumspricht, dass die Mathematik die Sprache der Natur (Galileo) und die Königin ALLER Wissenschaften (Gauß) ist.

    Aber, sehr geehrter Herr Dr. Courts, ohne Ihnen zu nahe treten zu wollen, erwecken Sie mir doch den Eindruck eines klassischen Molekularbiologen und damit eines mathematischen Wenigkönners.

  5. #5 Cornelius Courts
    31/10/2011

    @Karl: obgleich ich zustimme, daß die Mathematik wichtig und bedeutend ist und auch in der Biologie gebraucht und geschätzt wird (und das auch kein einziger Biologe, den ich kenne, in Abrede stellt), scheint mir Ihr mathematischer Narzissmus, traurig gekrönt durch die ernsthafte Verwendung des Gauß-Zitates, darauf hinzuweisen, daß Sie, ohne Ihnen zu nahe treten zu wollen, ein denkerischer Garnichtskönner sind.

  6. #6 Otto von Braackenssieck
    31/10/2011

    ZITAT:”daß Sie, ohne Ihnen zu nahe treten zu wollen, ein denkerischer Garnichtskönner sind.”
    Also sprach der “Wissenschaftler” und “Entnormalisierder” Cor Courts 🙂

  7. #7 Cornelius Courts
    31/10/2011

    Nee, nee, der Otto wieder. Hat vermutlich den ganzen Nachmittag im Heim über dieser Bombe von Spruch gebrütet. Also gut: hast Du fein gemacht, Otto. Bist ein ganz ein Braver.

    Ham’ wir’s dann jetzt?

  8. #8 Claudia
    31/10/2011

    Irgendwie mußte ich spontan daran denken… 😉 https://bit.ly/uQXLLi

  9. #9 Karl
    31/10/2011

    Immerhin können wir darin übereinstimmen, “daß die Mathematik wichtig und bedeutend ist und auch in der Biologie gebraucht und geschätzt wird”.

    Auch muss ich ein großes Lob aussprechen: Der Blog ist ja durchaus interessant und verständlich geschrieben. Ich schaue hier wirklich ganz gern mal ab und zu rein, auch wenn es für meinen Geschmack auch etwas “unblutiger” (s. auch Banner) zur Sache gehen könnte.

  10. #10 Cornelius Courts
    01/11/2011

    @Karl: danke für die Rückmeldung; ich gebe zu, daß einige Posts für manchen Leser etwas heftig sein mögen, doch gehören diese Dinge tatsächlich zum forensichen Alltag und deshalb möchte ich auch darüber berichten. Vielleicht sollte ich aber auch vor solchen Beiträgen eine Warnung anbringen…

  11. #11 Rainer Dynszis
    04/08/2016

    Ich habe soeben entsetzt gelesen: Im Wikipedia-Artikel mit dem Titel “DNA-Reihenuntersuchung” steht wörtlich: “Die erstellten Muster kommen statistisch bei 100.000 Menschen einmal vor, in jeder größeren Stadt also mehrfach.”

    Wie passt das zusammen?

  12. #12 HF(de)
    28/10/2016

    “Wie passt das zusammen?” Würd mich auch interessieren. Hab versucht, das über Wiki rauszufinden, aber das ist mir nicht gelungen. Ev. Methoden, die billiger, aber nicht so aussagekräftig sind?

  13. #13 Cornelius Courts
    28/10/2016

    @HF(de): ” Ev. Methoden, die billiger, aber nicht so aussagekräftig sind?”

    So ist es. Bei den Reihenuntersuchungen geht es ja vor allem darum, die allermeisten Kandidaten auszuschließen und das ist immer leicht möglich. Wenn dann mal bei einem Kandidaten eine vollständige Übereinstimmung beobachtet wird, macht man natürlich noch ein komplettes Profil, um sicherzugehen. So eine Übereinstimmung findet sich dann aber eben nur alle 100.000 Mal, so daß es gut beherrschbar bleibt.

  14. #14 HF(de)
    29/10/2016

    Vielen Dank!