In der letzten Folge haben wir gesehen, wie man zahlreiche STR-Systeme gleichzeitig mittels Multiplex-PCR vervielfältigt und dabei farblich markiert, um das dabei entstehende Gemisch von DNA-Fragmenten hinterher kapillarelektrophoretisch ordnen und analysieren zu können. Das Endergebnis ist ein DNA-Profil das aus den Angaben „STR-System” und Allel(kombination) besteht und das, so habe ich behauptet, nur einmal auf der Welt vorkommt.
In dieser Folge erkläre ich, warum und wie man berechnen kann, wie selten so ein DNA-Profil ist und ich beweise, daß meine Behauptung stimmt.
Bevor wir aber mit dem DNA-Profil selbst loslegen, müssen wir noch einige Grundlagen erarbeiten:
1. Wahrscheinlichkeit von Ereignissen
Die Wahrscheinlichkeit, daß ein Ereignis eintritt, hat einen Wert zwischen 0 und 1, wobei 0 für eine 0%- und 1 für eine 100%-Wahrscheinlichkeit steht. 0 und 1 sind die Absolutwerte, d.h. ein Ereignis mit Wahrscheinlichkeit 0 bzw. 1 wird niemals bzw. sicher eintreten.
Welche Wahrscheinlichkeit aber nun das Eintreten eines bestimmten Ereignisses hat, hängt vollständig davon ab, in welcher Umgebung des Ereignis auftreten kann und unter welchen Bedingungen.
Nehmen wir als Beispiel den 6-seitigen, ungezinkten Würfel. Wenn wir ihn werfen, hat das Ereignis E1, daß eine 1,2,3,4,5 oder 6 fällt, eine Wahrscheinlichkeit von 1 und das Ereignis E0, daß keine dieser Zahlen gewürfelt wird, eine Wahrscheinlichkeit von 0. Beide Ereignisse schließen sich aus, es kann nur das eine oder das andere eintreten, nicht beide zusammen oder eine „Schnittmenge” von beiden.
Die Wahrscheinlichkeit, daß eine „1″ fällt, ist genauso hoch, wie daß irgendeine andere Zahl fällt. Bei sechs Möglichkeiten und einer gleichmäßigen Verteilung der Wahrscheinlichkeiten auf alle Möglichkeiten also E1 : 6 = 1/6 = 0,1666666.
Wie wahrscheinlich ist es aber, daß, wenn man einen zweiten, gleichartigen Würfel hinzunimmt und beide gleichzeitig wirft, beide Würfel eine „1″ zeigen? Für jeden einzelnen Würfel gilt natürlich das eben ermittelte: eine „1″ tritt mit einer Wahrscheinlichkeit von 1/6 auf. Da sich aber die beiden Würfel gegenseitig nicht beeinflussen können, also unabhängig voneinander sind, wird nur in einem von sechs Fällen, in denen ein Würfel eine „1″ zeigt, auch beim anderen eine „1″ fallen. Also 1/6 von 1/6. Das ist 1/36 (= 1/6 x 1/6) von einem Ganzen. Kurz: das gleichzeitige Eintreten von zwei unabhängigen Ereignissen ist so wahrscheinlich, wie das Produkt der Einzelwahrscheinlichkeiten beider Ereignisse.
2. Vererbung von Merkmalen nach Mendel
Ein Mensch besitzt 23 Chromosomenpaare. 22 Autosomen- und ein Geschlechtschromosomenpaar (Frau: XX, Mann: XY). Bis auf die Geschlechtschromosomen beim Mann sind die Partner eines Paares gleich (nicht identisch), indem sie die gleichen Gene in der gleichen Reihenfolge enthalten. D.h. jeder Mensch hat von jedem Gen bzw. von jedem DNA-Abschnitt, zwei Kopien: eine auf jedem Partner eines Chromosomenpaares. Diese Genkopien müssen sich aber nicht identisch gleichen, sie können kleine oder größere Abwandlungen haben und man nennt die Varianten eines Gens „Allel” (hier ist das ausführlicher beschrieben).
Das eine Allel wurde vom Vater, das andere von der Mutter vererbt, die beide selber jeweils zwei Allele dieses Gens besitzen. Welches der beiden Allele vererbt wird, bestimmt der Zufall, also liegt die Wahrscheinlichkeit, daß ein bestimmtes Allel vererbt wird, bei 0,5. Daß also ein Kind eine bestimmte Kombination von Allelen der Eltern erhält, hat eine Wahrscheinlichkeit von 0,25 (= 0,5 x 0,5) oder ¼, weil die Vererbung der Allele durch die Elternteile unabhängig voneinander verläuft.
Die Abbildung zeigt die Vererbung eines Merkmals, das vier mögliche Allele (A,B,C,D) hat. Der Vater hat die Allele A und B, die Mutter C und D. Deren Nachkommen haben immer eine Kombination aus einem väterlichen und einem mütterlichen Allel und alle vier möglichen Kombinationen sind gleich wahrscheinlich.
Genau so funktioniert auch die Vererbung der Allele von STR-Systemen. Jeder von uns besitzt für jedes STR-System zwei Allele, eins vom Vater eins von der Mutter.
3. Grundlagen der Populationsgenetik
„Die Populationsgenetik ist der Zweig der Genetik, der Vererbungsvorgänge innerhalb biologischer Populationen untersucht. Sie ermittelt die relative Häufigkeit homologer Gene (Allele) in Populationen (Genfrequenz) und erforscht deren Veränderung unter dem Einfluss von Mutation, Selektion, zufälliger Gendrift, der Separation von Teilpopulationen und dem Genfluss zwischen Populationen. Sie hat eine große Bedeutung in der Evolutionsforschung sowie in der Tier- und Pflanzenzucht.
Ein wichtiger Grundsatz der Populationsgenetik ist das schon 1908 von Wilhelm Weinberg und Godfrey Harold Hardy unabhängig entdeckte Hardy-Weinberg-Gesetz, das bei rein zufälliger Paarung und in Abwesenheit jeglicher Selektion einen Gleichgewichtszustand beschreibt, in dem die Häufigkeit der Allele eines Gens von Generation zu Generation konstant bleibt.” Wikipedia
Um etwas über die Seltenheit eines DNA-Profils, das sich ja aus einer Kombination von Allelkombinationen in z.B. 16 STR-Systemen zusammensetzt, aussagen zu können, müssen wir wissen, wie häufig die Allele aller getesteten STR-Systeme in der Bevölkerung auftreten.
Das geht nur empirisch, d.h., man muß eine ausreichend große Stichprobe (200+) aus der Gesamtbevölkerung ziehen und in dieser Stichprobe die Allelverteilung in diesen STR-Systemen messen. Unter bestimmten Bedingungen (die hier als gegeben vorausgesetzt werden dürfen) kann man dann die Allelverteilung in der Stichprobe auf die Gesamtbevölkerung übertragen. Dabei gilt dann: je häufiger ein bestimmtes Allel ist, desto wahrscheinlicher ist es, daß eine beliebige Person, die ich mir aussuche, genau dieses Allel besitzt.
Wie oben beschrieben, besitzt ein Mensch aber nicht nur ein sondern immer zwei Allele für jedes STR-System, eines auf jedem Chromosom eines Chromosomenpaares. Um also zu ermitteln, wie selten ein STR-Genotyp (der ja aus zwei Allelen besteht) ist, reicht es nicht, nur die Häufigkeit der Allele in der Population zu kennen, man muß auch berechnen, wie selten die Kombination genau dieser beiden Allele ist. Die mathematische Grundlage dafür sind die Gleichungen von Hardy und Weinberg, die besagen, daß in einer Population unter diversen Annahmen (die wir aber für die STR-Systeme als näherungsweise erfüllt ansehen dürfen) für ein Merkmal für die Häufigkeit der Genotypen folgendes gilt:
p2 + 2 pq + q2 = 1
Dabei steht p für die Häufigkeit des Allels P und q für die Häufigkeit aller Allele, die nicht P sind (also 1-p = q).
Da wir die Häufigkeiten der Allele der STR-Systeme kennen, können wir nun die Häufigkeit jedes STR-Genotypen berechnen.
Beispiel: im STR-System „FGA“ besitzt ein Mensch die Allele 18 (p) und 20 (q). Aus einer Tabelle entnimmt man die Häufigkeit der Allele: p = 0,0227 und q = 0,1629. Der Genotyp dieses Menschen ist heterozygot, also gemischterbig, er besteht aus zwei verschiedenen Allelen und daher hat diese Kombination eine Häufigkeit von 2 x p x q oder 2 x 0,0227 x 0,1629 = 0,00739566. Das entspricht einer Häufigkeit von 0,739566 % und bedeutet, daß nur ca. 0,7 % der Bevölkerung im FGA-System genau diese Allelkombination besitzt!
Ein weiteres Beispiel: ein anderer Mensch besitzt im STR-System „FGA“ nur das Allel 18 (p), weil er homozygot ist, also reinerbig, d.h. auf beiden Chromosomen hat er dasselbe Allel. Dieser Genotyp hat die Häufigkeit p2 = p x p = 0,0227 x 0,0227 = 0,00051529. Das entspricht einer Häufigkeit von 0,051529%, womit dieser FGA-Genotyp sogar noch viel seltener wäre.
So, jetzt haben wir die Grundlagen, um zu verstehen, wie die kombinierte Häufigkeit eines forensischen DNA-Profils berechnet wird. Dazu noch folgende Anmerkungen/Voraussetzungen:
– wir kennen die Häufigkeit jedes Allels aus jedem STR-System
– die von uns verwendeten STR-Systeme werden nach den mendel’schen Regeln vererbt (wie unter 2. beschrieben)
– die Vererbung eines Allels aus einem bestimmten STR-Systems beeinflusst in keiner Weise die Vererbung eines Allels aus irgendeinem anderen STR-System, sie werden also vollständig unabhängig voneinander vererbt
– alle Allelkombinationen aller STR-Systeme sind evolutiv neutral, d.h., keine mögliche Allelkombination beeinflusst in irgendeiner Weise die Wahrscheinlichkeit, daß ein Individuum sich besser/schlechter fortpflanzt
Unter diesen Voraussetzungen kann man dann die kombinierte Häufigkeit eines DNA-Profils als Produkt der Einzelwahrscheinlichkeiten der Genotypen aller vom Profil umfassten STR-Systeme berechnen. Nehmen wir noch mal unser altes DNA-Profil her:
STR-System | Allele von Person X |
Häufigkeit der Allele |
Häufigkeit des Genotyps |
SE33 |
15,29.2 |
0,051 / 0,005 |
0,00051 |
D21S11 |
27 |
0,037 |
0,001369 |
vWA |
16,20 |
0,214 / 0,0165 |
0,007062 |
TH01 |
9.3 |
0,3031 |
0,09186961 |
FGA |
23,26 |
0,1439 / 0,0152 |
0,00437456 |
D3S1358 |
13,17 |
0,0071 / 0,2186 |
0,00310412 |
D8S1179 |
9 |
0,011 |
0,000121 |
D18S51 |
11,21 |
0,02 / 0,01 |
0,0004 |
Wenn man jetzt die Einzelhäufigkeiten der Genotypen multipliziert, kommt man auf eine Gesamthäufigkeit dieses Profils von 0,00000000000000000001, d.h. nur 0,000000000000000001% der Bevölkerung hat dieses Profil. In anderen Worten: dieses Profil würde bei weit (!) weniger als einer Person von 7.000.000.000 (= derzeitige Weltbevölkerung) zufällig noch einmal auftreten, womit man jenseits jeden vernünftigen Zweifels davon ausgehen darf, daß es einmalig auf der Welt (und sogar in der Menschheitsgeschichte) ist.
Wenn also beispielsweise ein solches DNA-Profil, das aus der Hautabriebspur an einer Mordwaffe erzeugt worden ist, voll übereinstimmt mit dem DNA-Profil eines Tatverdächtigen, so kann man sicher sein, daß diese Spur vom Tatverdächtigen stammt (hingegen nicht, daß er den Mord auch wirklich begangen hat!).
So. Und damit endet diese Serie, in deren Verlauf wir die Grundlagen und einzelnen Stufen eines forensischen Spurengutachtens kennengelernt haben:
Für das tiefere Verständnis gab es dazu noch folgende Basics-Artikel:
Danke und Respekt für alle, die bis hierhin durchgehalten haben.
Kommentare (14)