Ich kann mit hoher Wahrscheinlichkeit erraten, wie dein Ur-Ur-Ur Großvater – väterlicherseits – mit Nachnamen hieß: Genauso wie du. Was trivial klingt hat kulturelle Hintergründe. Traditionell nehmen Ehepaare bei der Hochzeit den Nachnamen des Bräutigams an, und die Kinder heißen dann ebenso. Nicht nur der Nachname wird so über Generationen weitergegeben, auch das Y-Chromosom männlicher Nachkommen stammt immer vom Vater, und der hat es von dessen Vater, und so weiter.

Genealogie heißt die Erforschung der Abstammungsverhältnisse. Es ist eine Hilfswissenschaft, die wohl vor allem von Großvätern mit viel Zeit ausgeübt wird, und in den USA überaus populär ist. Seit ein paar Jahren wird die Genealogie durch moderne DNA Sequenziermethoden unterstützt. In großen, öffentlichen Datenbanken wie Ysearch und SMGF werden Informationen zu kurzen, sich wiederholenden aber individuell sehr unterschiedlichen DNA Sequenzen des Y-Chromosoms gespeichert, sowie die dazugehörigen Nachnamen. Das hilft den Garagenahnenforschern, etwas über die eigenen Wurzeln heraus zu finden. Man lässt kommerzielle Unternehmen die eigenen sogenannten Short Tandem Repeat (STR) Regionen sequenzieren, und vergleicht die Ergebnisse über eine einfach Eingabemaske dann mit den Einträgen in den Sequenzdatenbanken.

Den Nachnamen aus Sequenzdaten bestimmen

DNA Sequenziermethoden werden nicht nur zur privaten Ahnenforschung genutzt. Es gibt große, wissenschaftliche Studien mit dutzenden bis tausenden Teilnehmern, bei denen die DNA der Probanden möglichst komplett sequnenziert wird, beispielsweise um einen Eindruck von der generellen Variabilität menschlicher DNA zu bekommen, oder um bestimmte phänotypische Eigenschaften Unterschieden in der DNA zu zu ordnen. Die Teilnehmer dieser Studien werden in den allermeisten Fällen anonymisiert, so dass durch die Analyse der DNA Sequenzen kein Rückschluss auf die Identität des Teilnehmers möglich ist – oder möglich sein sollte.

Letzte Woche wurde ein Paper in Science publiziert (Gymrek et al.), in dem berechnet wurde, wie hoch das Risiko ist, den Namen eines Probanden zu identifizieren – nur durch die Nutzung öffentlich zugänglicher Datenbanken und durch Internetsuchen. Die Autoren zeigen an einem Testset, dass ihr Algorithmus optimal eingestellt 12% der Namen korrekt identifiziert (5% falsch positiv, 83% unbekannt). In Kombination mit relativ unspezifischen Informationen wie Geburtsjahr und bewohntem US-Bundesstaat war es den Autoren möglich, die Zahl der möglichen Spender einer DNA Probe auf durchschnittlich ein Dutzend Personen einzuschränken.

Die Ergebnisse der Gruppe aus israelischen und US-amerikanischen Forschern sind nicht erschreckend, sie zeigen aber, das die Anonymität von Teilnehmern an großen DNA-Sequenzierstudien unter Umständen nicht gewahrt bleibt, vor allem wenn zusätzliche persönliche Informationen verfügbar sind, auch wenn diese relativ allgemein sind, wie Alter und Nationalität.

Weniger ist mehr: Datenschutz und kommerzielle DNA-Analysen

Es gibt noch eine dritte Gruppe Menschen, die Teile ihrer DNA sequenzieren lassen. Während das Ziel der Ahnenforscher ist, über STRs die eigene Abstammung zu rekonstruieren, sind ein Großteil der privaten Kunden von Sequenzierunternehmen auf etwas ganz anderes aus: Sie interessieren sich für die Wahrscheinlichkeit in Zukunft an bestimmten Krankheiten zu leiden. Dazu werden sogenannte SNPs analysiert, also ebenfalls kurze DNA Sequenzen, die mit dem Auftreten von Krankheiten assoziiert sind. Menschen, die sich durch die Sequenzierung von SNPs über Krankheitsrisiken informieren haben oft gute Gründe, ihre Anonymität zu wahren.

Wie hoch ist also das Risiko, dass durch die Analyse dieser SNP-Daten Rückschlüsse auf die Person möglich sind? Dazu habe ich Bastian Greshake befragt, Gründer von openSNP, einer Plattform auf der die Ergebnisse solcher SNP-Analysen publiziert, analysiert und diskutiert werben können.

WeiterGen: Bastian, ist die Anonymität der Benutzern von openSNP nach der Publikation des Gymrek-Papers noch gewährleistet?

Bastian Greshake: Ich vermute das es aktuell nicht so einfach wäre die Benutzer von openSNP mit Nachnamen anreden zu können (also wenn sie ihn nicht angegeben haben). Komplett ausschliessen kann man das natürlich nicht. In dem Paper dort nutzen sie die Haplotypen von bis zu 60 Y-chromosomalen Short Tandem Repeats, darin steckt, meiner Ansicht nach, um einiges mehr an Ancestry-Information, als man über die SNPs die 23andMe auf dem Y-Chromosom testet bekommt (openSNP nutzt hauptsächlich SNP-Daten von 23andMe-Analysen, WG).

1 / 2 / Auf einer Seite lesen

Kommentare (10)

  1. #1 Spoing
    29. Januar 2013

    Da kann man für die Zukunft ja nur sagen: Wohl dem der ein Kuckuckskind ist 🙂

  2. #2 MartinB
    29. Januar 2013

    Interessant, bis auf den Einstiegssatz
    ” wie dein Ur-Ur-Ur Großvater – väterlicherseits – mit Nachnamen hieß: Genauso wie du.”
    Wirklich? Auch wenn dein gegenüber eine (möglicherweise verheiratete) Frau ist?

  3. #3 rolak
    29. Januar 2013

    Ok, MartinB hat den großen, alten Haken gesetzt, da bleibt mir nur der kleine, neue: Was ist mit meinem Neffen, dessen Vater bei der Hochzeit den Namen seiner Frau angenommen hat? (Nicht fiktiv..)

    Doch interessant bleibt es.

  4. #4 MartinB
    29. Januar 2013

    @rolak
    Sorry, aber ich meine das ernst – es zeigt, dass der Autor des Artikels sich mit hoher Wahrscheinlichkeit einen Leser vorgestellt hat, keine Leserin. Finde ich interessant – sowas passiert einem viel leichter als man denkt.

  5. #5 Tobias Maier
    29. Januar 2013

    Ich stelle mir meine Leser jung und unverheiratet vor, männlich wie weiblich. Deshalb das Du im ersten Absatz.

  6. #6 MartinB
    29. Januar 2013

    @Tobias
    Ach so – so alte verheiratete Zausel wie mich muss man Siezen?
    Es war auch nicht als böse Kritik gemeint, sondern nur als Fingerzeig auf eine unbewusste Annahme – sowas finde ich immer interessant (passiert mir selbst ja auch oft).

  7. #7 Tobias Maier
    29. Januar 2013

    Ja, MartinB, so leid es mir tut, aber du passt leider nicht in meine anvisierte Zielgruppe (ich duze Sie mal einfach).

  8. #8 rolak
    29. Januar 2013

    Es fiel mir auch in keiner Weise ein, Deinen¹ Kommentar nicht ernst zu nehmen, MartinB, wollte nur einen weiteren, zugegebenermaßen aktuell relativ unwahrscheinlichen Knackpunkt aufführen.

    ___________________
    ¹ Na, fühlst Du¹ Dich¹ jetzt besser? ²
    ² Habe ich gerade eben die rekursive Fußnote erfunden? Falls überhaupt jemand bis hierher und zur Antwort kommt…

  9. #9 michael
    29. Januar 2013

    > Habe ich gerade eben die rekursive Fußnote erfunden?

    Nein: https://www.thudgame.com/node/955

  10. #10 rolak
    30. Januar 2013

    Danke, michael, hätte mich auch schwer gewundert, zu naheliegend. Und sicher wert, über diverseste Zwischenstufen zu einer schön auschweifenden Rundreise durch Texte und sites ausgeweitet zu werden 😉