Acht Millionen neu entdeckte Unterschiede bei der Sequenzierung menschlicher Genome. 60 neue Mutationen von einer Generation zur nächsten. Drei unterschiedliche Sequenzierstrategien. Das 1000-Genomes-Konsortium hat eine Pilotstudie in Nature publiziert. Hier ein Überblick über die Ergebnisse und deren Bedeutung.
Das Titelblatt der Zeitschrift Nature von letzter Woche zeigt einen stilisierten Erdball mit bunten Menschen darauf und einer den Äquator umspannenden Banderole: “A thousand genomes” steht da. Anlass ist die Publikation eines Pilotpapers (.pdf) des 1000 Genomes Konsortiums.
Die Idee hinter dem 1000 Genomes Konsortium ist, den Zusammenhang zwischen Genotyp – also den individuellen Unterschieden in der DNA Sequenz – und dem Phänotyp – also der messbaren Unterschiede zwischen Menschen – zu untersuchen. Das Ziel der präsentierten Studie war relativ seltene genetische Unterschiede zwischen Individuen zu identifizieren und zu kartieren; Unterschiede die mindestens bei 1% aller Menschen auftreten. Und das Konsortium war erfolgreich. Insgesamt kennt man nun rund 15 Millionen genetische Varianten. Das sind Punktmutationen, kleinere Insertionen und Deletionen sowie größere strukturelle Reorganisationen der DNA. Acht Millionen dieser Varianten wurden alleine in dieser neuen Studie entdeckt.
Die Ergebnisse dreier unterschiedlicher Sequenzierungsstrategien werden in der Veröffentlichung präsentiert: Zum einen wurde die DNA von 179 Menschen Menschen aus vier unterschiedlichen Populationen (Yoruba aus Nigeria, kaukasisch, Han-Chinesen und Japaner) jeweils 2-4 Mal sequenziert (low coverage). Zweitens wurden nur die Exons, also die proteinkodierenden Stücke von 906 zufällig ausgewählten Genen, von rund 700 Individuen aus sieben Populationen sequenziert; und zwar im Durchschnitt jeweils über 50 Mal. Schließlich wurden für den dritten Ansatz zwei Familien bestehend aus Vater, Mutter und Tochter aus Nigeria und Utah ausgewählt (Trio). Deren DNA wurde jeweils über 40 Mal komplett sequenziert.
Venn-Diagramme der bekannten und neu identifizierten Polymorphismen bei den drei Sequenzierungsstrategien. Die farbigen Kreise stehen jeweil für die Populationen. Abbildung aus der Publikation.
Warum sind verschiedene Sequenzierungsstrategien gewählt worden? Es sind wohl trotz ständig sinkender Preise hauptsächlich die Kosten für die eigentlichen Sequenzierreaktionen, die Datenauswertung und die Datenspeicherung, welche die Forscher zu einem doppelten Kompromiss zwingen. Um neue, seltene genetische Varianten zu finden, macht es natürlich Sinn, viele unterschiedliche Individuen komplett zu untersuchen. Andererseits sind Sequenzunterschiede in den sogenannten Exons, also den DNA-Stücken, die tatsächlich in mRNA transkribiert und in Proteine translatiert werden wahrscheinlichere Kandidaten für veränderte Phänotypen und somit interessanter. Sie werden daher bevorzugt sequenziert. Und die häufigen Wiederholungen der Sequenzierung der DNA der selben Personen ist notwendig, um für die Fehlerrate bei den Sequenzierungsreaktionen zu kompensieren. So kann also mit hoher Wahrscheinlichkeit ein tatsächlich auftretender genetischer Polymorphismus von einem einfachen, technischen Fehler unterschieden werden.
Die eigentliche Sequenzierung der jetzt publizierten Daten wurde übrigens bereits 2008 abgeschlossen. Nature geht davon aus, dass aktuell bereits 2700 Genome sequenziert sind – wenn auch noch nicht analysiert. Das Magazin sagt voraus, dass diese Zahl im Zuge der Zunahme der weltweit installierten Sequenzierungsgeräte bis in einem Jahr auf 30 000 Genome ansteigt. Neue Technologien, die eine noch höhere Parallelisierung, Genauigkeit und Geschwindigkeit der Sequenzierung erlauben sind bereits erfunden und entwickelt. Ein Ende der massenhaften Sequenzierung menschlicher Genome ist also nicht absehbar und die Preise werden weiter sinken. Das Zwischenziel ein menschliches Genom für unter 1000 Euro zu sequenzieren rückt in greifbare Nähe. Neben den Kosten, dem Aufwand der bioinformatischen Auswertung und der Aufgabe der dauerhaften Speicherung der generierten Datenmegen, ist die größte und komplizierteste Herausforderung vor allem das langfristige Ziel der funktionalen Annotation der gefundenen Polymorphismen.
Aktuelle (hellblau) und erwarte (violett) Anzahle sequenzierter menschliche Genome *500 in Europa. Grüne Säule: Aktuelle Anzahl der sich im Einsatz befindenden Deep-Sequencing Maschinen im akademischen Umfeld in Europa. Abbildung von hier
Die wohl entscheidende Frage ist jedoch: Wozu der ganze Aufwand? Nature geht in einem die Publikation begleitenden Dokument auf diese Frage ein und identifiziert drei Hauptgründe. Es geht um das Verstehen von Populationen, von Krankheiten, und von einzelnen Individuen. Hier nur stichwortartig, was das damit gemeint sein könnte: Die Sequenzierung der Familien ergab, dass pro Generation rund 60 neue genetische Variationen hinzukommen. Dies, sowie die gefundenen Unterschiede und Gemeinsamkeiten zwischen verschiedenen Ethnien erlauben Einblicke in die jüngere Evolution des Menschen. Weiter können genom-weite Assoziationsstudien Aufschluss darüber geben, welche Polymorphismen bei Krankheiten mit relativ hohem genetischen Anteil, wie beispielsweise Diabetes, Asthma oder Arthritis eine Rolle spielen. Die Sequenzierung von Krebsgenomen hilft bei der Identifikation und Bewertung der genetischen Risikofaktoren dieser komplexen Krankheit. Je mehr Genome sequenziert werden, desto wahrscheinlich wird es, einzelnen Polymorphismen, oder Kombinationen derselben, Risiken zu zuordnen – und eröffnet so die Möglichkeit rechtzeitig potentiell lebensverlängernde Maßnahmen zu ergreifen. Sei es beispielsweise die Umstellung der Ernährung, der Besuch regelmäßiger Krebs-Screenings oder die präventive Einnahme von Medikamenten.
Seine eigene DNA-Sequenz zu kennen wird also erschwinglich und kann durchaus Vorteile bieten. Dabei ist nicht einmal nötig, sein gesamtes Genom sequenzieren zu lassen. Kommerzielle Anbieter von DNA-Tests wie 23andMe, bieten schon jetzt für weit unter 1000 Euro die spezifische Sequenzierung bekannter Polymorphismen nebst deren Auswetung in graphisch ansprechender Form an. Vor allem der verantwortungsvolle Umgang mit personalisierten Genomdaten ist ein gesellschaftlich, medizinisch und juristische weitgehend ungeklärtes Problem. Wie sind diese Daten geschützt? Wer kann und darf diese Daten wie und wann nutzen? Das sind wichtige Fragen für eine öffentliche Debatte.
Durbin, R., Altshuler, D., et al. (2010). A map of human genome variation from population-scale sequencing Nature, 467 (7319), 1061-1073 DOI: 10.1038/nature09534
Kommentare (34)