also wahrscheinlich und falls Du Han-Chinese bist (, wie bekanntlich ca. jeder 5. Mensch).
So könnte man eine Arbeit in FSI:Genetics von Shi et al. zusammenfassen, die aus dem Zusammenhang der gemeinsamen Vererbung von y-chromosomalen STR-Haplotypen und Nachnamen eine Methode entwickelten, wie man von einem y-chromosomalen DNA-Profil mit einiger Wahrscheinlichkeit den Nachnamen eines Han-Chinesen vorhersagen kann [1].
(Hinweis: als Grundlagen für diesen Artikel empfehle ich die Lektüre der Serie zur forensischen Genetik)
Wie auf den Autosomen gibt es auch auf dem Y-Chromosom STR-Systeme, die forensisch-molekularbiologisch bedeutend sind. Weil dieses Chromosom aber so klein ist, gibt es dort fast keine Rekombination und daher sind alle y-chromosomalen STR-Systeme, die forensisch relevant sind, genetisch gekoppelt, sie werden also zusammen vererbt, sozusagen „en bloc“. Da Männer nur und immer an ihre Söhne ihr Y-Chromosom weitergeben, besitzen alle in männlicher Linie verwandten Männer das gleiche Y-Chromosom. Kleine Veränderungen können über die Generationen hinweg durch Mutationen entstehen, doch das kann man relativ gut nachhalten, so daß sich Y-Chromosomen hervorragend als „lineage marker“, als genetische Marker zur Verfolgung von Erblinien eignen.
Forensisch ist das Y-Chromosom interessant, weil man damit männliche Spurenanteile auch in Mischspuren, in denen weibliche Anteile sehr stark überwiegen, nachweisen kann. Bei einer Mischspur aus einem Sexualdelikt, die überwiegend aus weiblichen Epithelzellen aus dem Urogenitalbereich und vielleicht einigen wenigen Spermen und männlichen Epithelzellen besteht, kann man nur in seltenen Fällen die männlichen autosomalen Merkmale noch so darstellen, daß man daraus ein gutes DNA-Profil ableiten kann, das geeignet ist, um einen Täter zu identifizieren, weil die männlichen Merkmale vor dem viel stärkeren weiblichen Signalvordergrund zu schwach sind. Frauen aber haben kein Y-Chromosom und so lassen sich y-chromosomale Merkmale auch noch in Mischungen mit viel mehr weiblicher DNA sehr gut darstellen und können dann bei der Identifizierung von Tatverdächtigen helfen. Außerdem kommt man auch in einigen komplizierten Abstammungsuntersuchungen man nur unter Zuhilfenahme von y-chromosomalen Merkmalen zum Ziel.
Und weil y-chromosomale Merkmale, wie gesagt, in männlicher Linie vererbt werden und man mit ihnen Erblinien nachverfolgen kann, eignen sie sich auch für phylogenetische Untersuchungen sowie um Information zur biogeographischen Herkunft eines Mannes zu gewinnen. Letzteres kann natürlich bei forensischen Ermittlungen zu Fällen, wo es neben der DNA-Spur keinerlei Hinweise zu einem Tatverdächtigen gibt, eine erste Ermittlungsrichtung vorgeben, s. dazu auch den Artikel zu FDP. Daß die Möglichkeit, zusätzlich dazu auch den Namen eines Tatverdächtigen anhand seiner DNA abzuleiten, für forensische Ermittlungen von großem Vorteil wäre, liegt auf der Hand und ließe sich gewissermaßen als weiteren Aspekt des – im weitesten Sinne – „Phänotyps“ eines Tatverdächtigen interpretieren.
Und genau mit dieser Möglichkeit vom Y-Chromosom auf den Namen zu schließen, befaßt sich die Arbeit von Shi. Doch wie funktioniert es?
In den allermeisten Gesellschaften, so auch in China, werden die Nachnamen in männlicher Linie vererebt, d.h. die Kinder eines Paares tragen in der Regel den Nachnamen ihres Vaters. So kommt es, daß eine starke Ko-Segregation von Y-Chromosomen und Nachnamen zu beobachten ist. Abweichungen hiervon können sich natürlich durch Faktoren wie Adopotion, Nicht-Vaterschaften (der vermeintliche Sohn stammt von einem anderen Mann; daß das gar nicht so selten ist, sehe ich hier täglich auf der Arbeit), Mutationen etc. ergeben, doch der Trend ist eindeutig und ganz besonders ausgeprägt in China. China hat ohnehin historisch eine im Vergleich zur restlichen Welt geringe Diversität der Nachnamen, da diese dort aus kulturellen Gründen eher „stabil“ sind und große Kontinuität über lange Zeit aufweisen. Chinesen haben ein besonders „loyales Verhältnis“, so der Autor, zu ihren Nachnamen und ändern ihn höchst selten ohne guten Grund. Außerdem werden chinesische Nachnamen durch ganz besondere Schriftzeichen dargestellt und Varianten der Schreibweisen, wie man sie aus anderen Regionen kennt (Schmidt, Schmitt, Schmid etc.) gibt es so gut wie gar nicht. Daher ist bei chinesischen Nachnamen ein hohes Maß an gemeinsamer Vererbung mit Y-Chromosomen zu rechnen. Hinzukommt, daß knapp 1,3 Milliarden Chinesen nur 7300 verschiedene Nachnamen haben und die Han-Chinesen, die immerhin mehr als 90% aller Chinesen ausmachen, haben sogar nur 3000 Namen.
Han-Chinesen stellen also eine sehr gute Population dar, um eine solche Studie durchzuführen und die Autoren schlossen insgesamt 19.009 von ihnen in die Untersuchung ein. In dieser Stichprobe wurden 266 verschiedene Nachnamen gezählt. Die mittlere Häufigkeit war 71 mit breiter Streuung (1-1889). Von allen Probanden wurde dann DNA extrahiert und ein ein 17 Y-STR-Systeme (Y-Filer) umfassender Haplotyp bestimmt.
Ca. 10% der Probanden mußten wegen unvollständiger Y-STR-Daten ausgeschlossen werden und 15 STR-Loci konnten letztlich in die Vorhersage der Nachnamen einbezogen werden. Insgesamt wurden 5818 verschiedene Haplotypen beobachtet, die eine gesamte genetische Diversität von 0,9986 +/- 0,0001 ausmachten. Auf jeden Nachnamen entfielen zwischen 2 bis 684 Haplotypen und genetische Diversitäten zwischen 0,285 bis 1. Von den 5818 Haplotypen waren 84% nur bei einem bestimmten Nachnamen zu finden, 637 bei zwei und 175 bei drei Namen. Der meistverbreitete Haplotyp trat bei 27 Nachnamen auf. Obwohl die meisten Nachnamen demnach mit hoher genetischer Diversität assoziiert sind, wurde eine signifikante Korrelation zwischen dem Häufigkeitsrang eines Namens und der y-chromosomalen genetischen Diversität festgestellt (p = 5,93 E-08). Dieses Ergebnis ist konsistent mit einer langen historischen Stabilität chinesischer Nachnamen einerseits und einer gewissen Substruktur und unterschiedlichen Ursprüngen innerhalb der häufigen Nachnamen andererseits.
Zur Berechung der Ko-Vererbung erstellten die Autoren schließlich zwei Modelle: ein Modell der Kosinus-Ähnlichkeit (dcos) und ein Modell der Vererbungsdistanz (dcoal). dcos mißt das Ausmaß der Ähnlichkeit zweier Vektoren (Proben) anhand ihrer Winkel im Vektorraum (statt ihrer Länge). dcoal mißt die Ähnlichkeit zweier Proben unter den Annahmen der Koaleszenztheorie, mittels derer sich die Evolution von Y-Haplotypen in der Zeit modellieren läßt: je kürzer die anhand der Y-Haplotypen geschätzten Zeit bis zum ersten gemeinsamen Vorfahren (TMRCA) zweier zufällig gewählter Individuen, desto höher ist die Wahrscheinlichkeit, daß sie einen gemeinsamen Nachnamen haben. Die mathematischen Grundlagen erspare ich uns an dieser Stelle, das würde zu weit führen und zu technisch werden. Es genügt, zu sagen, daß beide Modelle annähernd gleich gut funktionierten; dcoal war ein bißchen besser als dcos, dafür aber wesentlich aufwendiger zu berechnen.
Hier sieht man die Leistung der beiden Modelle als Graphik:
Die durchschnittliche Genauigkeit der Vorhersage der fünf häufigsten Namen, die alle über 1000 mal vorkamen, liegt zwischen 83,23% und 89,84%:
Die Autoren errechneten auch, daß ein größeres Kollektiv (also eine größere Datenbank) und die Einbeziehung von weiteren Y-STR-Loci, insbesondere solcher mit hoher Mutationsrate, die Vorhersagegenauigkeit noch erhöhen würde. Der Grenzen ihrer Studie, die in der vergleichsweise (zur Gesamtpopulation) kleinen Stichprobe und der geringen Zahl einzigartiger Nachmen (266) bestehen, sind sich die Autoren bewußt und planen, ihre Untersuchungen auf größere Datensets auszuweiten.Zusammenfassend läßt sich dennoch sagen, daß hier eine relativ zuverlässige Methode zur Vorhersage eines Nachnamens anhand von y-chromosomalen DNA-Profilen vorgestellt wurde. Daraus folgt auch, daß in der untersuchten chinesischen Subpopulation ein hohes Maß an Ko-Vererbung von Nachnamen und Y-Haplotypen besteht. Besonders interessant könnten solche Untersuchungen auch in anderen Gesellschaften sein, wo von jedem Mitglied, z.B. gleich bei Geburt, ein DNA-Profil erhoben bzw. DNA gespeichert wird (wie z.B. und überraschenderweise in Kalifornien) und daher die Datenbanken besonders umfangreich sind. In Gesellschaften mit starker Namensstabilität in der Zeit könnten sehr gute Vorhersagewerte erreicht werden, was für forensische Ermittlungen ohne andere Spur zum Tatverdächtigen extrem interessant sein könnte.
____
Referenzen:
[1] Shi, C. M., Li, C., Ma, L., Chi, L., Zhao, J., Yuan, W., … & Chen, H. (2018). Inferring Chinese surnames with Y-STR profiles. Forensic Science International: Genetics, 33, 66-71.
Kommentare (25)