Dieser Artikel ist als Anlage zu meinem Gentest-Selbstversuch-Artikel zu verstehen, sozusagen als “Supplementary Material” :-). Hierin erkläre ich, wie das Verfahren zur DNA-Analyse beim von mir ausprobierten Gentest technisch funktioniert. Weil das nicht für alle interessant (und auch nicht ganz unkompliziert) ist, habe ich das ganze hierhin ausgegliedert. Als Vorbereitung bzw. zusätzliche Lektüre empfehlen sich die Artikel zu DNA und PCR (ohne Kenntnisse über die Prinzipien der PCR ist der folgende Artikel eher unverständlich).

Die Firma futuragenetics benutzt das sogenannte APEX-Verfahren. Dieses Akronym steht für „arrayed primer extension“ (dt. Verlängerung mittels angeordneter Primer) und bezeichnet ein einfaches und robustes enzymatisches Verfahren zur gleichzeitigen Typisierung hunderter bis Tausender Variationen im Genom in einer einzigen Multiplex-Reaktion.

Die Gentests, wie auch der, den ich selbst ausprobiert habe, beruhen in der Regel darauf, daß der Status mehrerer SNPs erhoben wird. SNPs sind Polymorphismen, die jeweils nur eine einzige Base der DNA betreffen und fast immer liegt ein SNP in einer von zwei (ganz selten drei) Varianten oder „Allelen“ vor, z.B. A oder C. Jeder Mensch hat nun von jedem SNP zwei Kopien, eine auf jedem Partner eines Chromosomenpaars: eine Kopie kommt also vom Vater, die andere von der Mutter. So ergibt sich stets eine Kombination der Allele, die als „Genotyp“ bezeichnet wird. Von jedem SNP gibt es also drei mögliche Genotypen: zwei mal homozygot (z.B. AA und CC) und einmal heterozygot (AC).

Der SNP selbst hat übrigens in den wenigsten Fällen direkt mit der eigentlich untersuchten Prädisposition für eine Erkrankung zu tun (gibt es aber auch), oft liegt er nichtmal im kodierenden Bereich des Gens, das mit der Krankheit in Verbindung steht. Er liegt aber zumindest so nahe am für die Krankheit relevanten genetischen Bereich, daß er daran gekoppelt ist, also stets zusammen mit dem Gen vererbt wird. Das heißt für unser Beispiel, daß wenn das Allel „A“ unseres SNPs neben einer genetischen Variante liegt, die mit einem höheren Krankheitsrisiko verbunden ist, dann wird wegen der Kopplung das A-Allel auch immer mit dieser Genvariante zusammen vererbt. Findet man also in der DNA einer Person dieses A-Allel, so weiß man, daß in der Nähe auch die pathogene Genvariante liegt. Man spricht dann von Assoziation: es reicht daher aus, nur das Allel des naheliegenden, also assoziierten SNPs anzuschauen, um zu wissen, daß das untersuchte Individuum auch die entsprechende Genvariante trägt. Daß diese Zusammenhänge überhaupt existieren, muß zuerst in genomweiten Assoziationsstudien (GWAS) herausgefunden werden. Dann aber ist es sehr praktisch, weil sich durch Verfahren wie APEX SNPs sehr schnell, leicht und in hoher Multiplexität (= viele gleichzeitig) untersuchen lassen.

Das kann man sich – Achtung, Analogie – vielleicht so vorstellen, wie Barcodes an verschlossenen Koffern: die Barcodes sind fest mit dem Koffer verbundenund geben Auskunft darüber, was im Koffer drin ist. (Daß das so ist, hat man vorher herausgefunden, indem man 10.000 Koffer aufgemacht, den Inhalt mit dem Barcode abgeglichen und dabei gesehen hat, daß der xy-Barcode immer an Koffern mit schmutziger, der xx Barcode hingegen kofferimmer an Koffern mit sauberer Wäsche klebt). Es reicht also, schnell den Barcode zu scannen, um den Inhalt des Koffers zu kennen, was viel leichter ist, als aufwendig das Kofferband zu entfernen, den Koffer aufzuschließen, zu öffnen und zu durchwühlen (und das will man vielleicht auch nicht unbedingt ;-).

Beim APEX-Verfahren werden nun Primer, also kurze Oligonukleotide, auf einer festen Unterlage fixiert, etwa einer Glasplatte, die man “Microarray” nennt. Die Sequenz dieser Primer ist genau komplementär zu der DNA-Sequenz, die exakt vor dem SNP, den man untersuchen will, liegt. Der SNP selber wird vom Primer jedoch nicht erfasst. Auf einem solchen Microarray haben zigtausende Primer Platz, die beliebige Sequenzen haben können, so daß mit einem einzigen Array viele Tausend SNPs gleichzeitig untersucht werden können.

flattr this!

1 / 2 / 3 / Auf einer Seite lesen

Kommentare (8)

  1. #1 tomtoo
    12/07/2016

    klasse technik.

    wo sind denn hier die phylosophen also denker und so ?

    alles gut ? keine gefahr ? nur positieves ?

    klasse geh ich wieder pennen.

  2. #2 Cornelius Courts
    12/07/2016

    @tomtoo: “klasse geh ich wieder pennen.”

    oder, statt immer nur zu pennen, vielleicht auch mal ein Buch lesen, zwischendurch? Oder vielleicht doch noch mal den Abschluß zum Homo erectus versuchen?

  3. #3 Lercherl
    12/07/2016

    Wie ist denn die Fehlerrate bei diesem Verfahren? Angenommen, ich bestimme 1000 SNPs: kann ich dann davon ausgehen, dass ich alle 1000 richtig und reproduzierbar bestimme? Bei 5000 Jahre alter Ötzi-DNA vermutlich weniger als bei sauberen Proben von Lebenden.

  4. #4 tomtoo
    12/07/2016

    @cornelius

    hör mal mein erectus geht dich mal garnix an.

    apropos buch .. so ein blog ist doch viel interaktiever.

    egal.

    können wir aus dem genom jetzt
    WAS herauslesen ?

    ?????

  5. #5 CM
    13/07/2016

    @Lercherl: Letztlich unterscheiden sich i.d.R. sogar Chargen der Firmen, die solche “Platten” herstellen. Doch gem https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-7-521 ist die Callrate (also der Anteil typisierter SNPs) bei 99.6% und die Concordanz (also der reproduzierbare Anteil*) bei 98.9% – das darf als Hausnummer für solche Tests aufgefasst werden. Der vorsichtige Wissenschaftler (mit Geld) überprüft ermittelt derartige Raten für jede Charge (also so gut wie nie 😉 ). Wenn man jetzt eine GWAS auswertet (üblicherweise mit Arrays oder NGS basiert, es werden also wesentlich mehr SNPs und auch andere Variationen erfasst) treibt man einiges an Statistik und Qualitätsmanagement, um das in den Griff zu bekommen.

    Letztlich enthalten GWAS-Publikationen immer auch eine Angabe zur Unschärfe der gemessenen bzw. per Metaanalyse gemittelten Risiken. Die müssten mit der Unschärfe der Tests konvolutiert werden. Das unterbleibt bei kommerziellen Anbietern.

    Bzgl. alter DNA: Die Fehlerrate bei guter DNA ist nicht per se schlechter als bei frischer DNA. Allerdings können meist weniger Positionen bestimmt werden. Anders sieht es aus, wenn die DNA stark degradiert ist. Dann wird die Statistik wesentlich komplexer und man ist oft gezwungen zu iterieren (moderne Referenz zu Kopplungsungleichgewicht bau eigener Referenzen). Ein Feld, in dem ich mich offengestanden wenig auskenne.

    *ungefähr

  6. #6 Cornelius Courts
    13/07/2016

    @Lecherl: “Wie ist denn die Fehlerrate bei diesem Verfahren? ”

    CM hat Dir in #5 ja schon einiges dazu gesagt. Allerdings stammen seine Zahlen aus einer 10 Jahre alten Studie. Die Technik ist inzwischen viel besser geworden, es gibt genauere Polymerasen, bessere Optik etc. Auch muß berücksichtigt werden, daß in der von mir beschriebenen Apex-Variante der SNP in beide Richtungen ausgelesen wird (sense und anti-sense Strang). Wenn diese beiden Ergebnisse nicht übereinstimmen, sieht man das sofort. Auch das reduziert die Fehlerrate nochmal deutlich. Ich kenne keine exakten Zahlen, schätze aber, daß die Fehlerrate bei diesem Verfahren wesentlich besser ist, als in der Studie von 2006.

    @tomtoo: “können wir aus dem genom jetzt WAS herauslesen ?”

    Nochmal der Tip: bevor Du Dich am Genomlesen versuchst, nimm doch lieber erstmal ein Buch. Mit kurzen Sätzen. Und großen Buchstaben. Und abwaschbaren Seiten.

  7. #7 CM
    13/07/2016

    @Cornelius: Zugegeben, ich bin nicht up to date. Doch https://www.ncbi.nlm.nih.gov/pubmed/19948333 sagt dieselben Zahlen. Etwas Neueres habe ich nicht finden können. Hast Du eine neuere Publikation? – interessieren würd’s mich schon.

  8. #8 Cornelius Courts
    13/07/2016

    @CM: “Hast Du eine neuere Publikation?”

    Nee, wie oben schon gesagt, habe ich leider keine Zahlen zur Fehlerrate, denke aber, daß die über die 10 Jahre deutlich besser geworden ist. Z.B. wegen Entwicklungen wie dieser hier (aus 2011): https://www.ncbi.nlm.nih.gov/pubmed/21294195