Zuvor müssen jedoch die DNA-Abschnitte, die die SNPs enthalten, aus der riesigen genomischen DNA aus der Speichelprobe erst einmal isoliert und vermehrt werden (der Großteil der genomischen DNA ist für diese Untersuchung irrelevant und würde nur stören). Dazu extrahiert man die DNA aus der Probe und reichert alle zu untersuchenden SNPs in einer großen Multiplex-PCR an. Die Primer für diese PCR sind so gewählt, daß die entstehenden PCR-Produkte die Regionen umfassen, in denen sich SNPs von Interesse befinden. In ihrer Sequenz entsprechen sie dabei den Primern, die auf dem Array aufgebracht sind.

Nach Abschluß der PCR werden die erzeugten Produkte noch chemisch fragmentiert, dadurch werden die die DNA-Stücke „handlicher“ und die Hybridisierung mit den Primern auf dem Array klappt besser. Von dieser Mischung fragmentierter PCR-Produkte wird dann etwas in einem Tropfen Flüssigkeit auf den Array aufgetragen. Daraufhin hybridisieren die DNA-Moleküle mit den auf dem Array fixierten Primern, so daß sich die letzte Base des Primers exakt an der letzten Base des DNA-Fragements vor dem SNP anlagert. Das Ganze passiert von beiden Seiten aus (also einmal „links“ und einmal „rechts“ vom SNP, das erhöht die Genauigkeit). Dann werden Polymerase und fluoreszenzmarkierte didesoxy(dd)-Nukleotide zugegeben. Diese ddNukleotide sind chemisch so verändert, daß eine Polymerase hinter ihnen kein weiteres Nukleotid in einen naszierenden DNA-Strang einbauen kann. Jedes der zugegebenen dd-Nukleotide, ddA, ddT, ddC und ddG, trägt dabei einen speziellen von vier verschiedenen Fluoreszenzfarbstoff (z.B. ddA immer gelb, ddT immer rot etc.), so daß man sie sozusagen an der Farbe unterscheiden kann.

apex1

aus [1]

Das Bild zeigt das Prinzip: links (1) ist zu sehen, wie sich ein DNA-Fragment eines Probanden an einen Primer (mit einer geschlängelten Linie an den Array (waagrechte Linien) gebunden) anlagert. Der Primer endet exakt vor dem SNP, bei dem der Proband ein A-Allel hat. In der Mitte (2) hat die Polymerase (nicht gezeigt) bereits ein komplementäres ddT eingebaut, das einen Fluoreszenzfarbstoff trägt (der graue Stern) und fest mit dem Primer verbunden wird, danach endet die Reaktion. Rechts (3) sieht man das Endprodukt: das hybridisierte DNA-Molekül wurde entfernt, der Primer ist um eine Base verlängert worden (hier: T) und zusätzlich durch einen auf „T“ hinweisenden Fluoreszenzfarbstoff markiert.

apex3

aus [2]

So wie auf dem Bild oben kann man dann sich einen solchen Array vorstellen: sehr viele verschiedene Primer sind eng an eng darauf befestigt. Dabei sind immer identische Primer in einem eng begrenzten Bereichd des Arrays („spot“) zusammen angeordnet, so wird eine Signalverstärkung erzielt.

Da die Position aller Primerspots auf dem Array bekannt ist, kann nun eine geeignete Kamera mit angepasster Bildauswertesoftware genau die Fluoreszenzsignale aller Spots auf dem Array auslesen, die durch Anregung der eingebauten Fluoreszenzfarbstoffe mit einem Laser induziert werden und aufgrund der Farbsignale auf die Identität der angefügten Nukleotide schließen. Ein gelber Spot etwa zeigt an, daß dort ein „A“ eingebaut wurde (und daß der Proband daher ein „T“-Allel in seinem SNP hat). Dabei sind natürlich auch Farbmischungen auswertbar, wie sie bei heterozygoten Genotypen (AT, gelb und rot) entstehen würden.

Nach Normalisierung und „Reinigung“ der Daten von Hintergrundrauschen und weiteren bioinformatischen Prozessierungsschritten gibt dann die Software für jeden SNP auf dem Array den Genotypen des Probanden aus. Das sind dann die Rohdaten des Tests, die ja auch Teil des Berichts waren. Hernach erfolgt noch die Interpretation der Ergebnisse auf Grundlage der Evidenz aus GWAS in Hinsicht auf die Einschätzung des genetischen Risikos des Probanden für die in die Untersuchung einbezogenen Krankheiten und auch diese Ergebnisse kommen in den Bericht.

Et voilà.

_____

Referenzen:

[1] Pullat, J., & Metspalu, A. (2008). Arrayed primer extension reaction for genotyping on oligonucleotide microarray. Prenatal Diagnosis, 161-167.

[2] P.J. Ulfendahl, Arrayed primer extension technique for nucleic acid analysis, Google Patents, 2001.

flattr this!

1 / 2 / 3

Kommentare (8)

  1. #1 tomtoo
    12/07/2016

    klasse technik.

    wo sind denn hier die phylosophen also denker und so ?

    alles gut ? keine gefahr ? nur positieves ?

    klasse geh ich wieder pennen.

  2. #2 Cornelius Courts
    12/07/2016

    @tomtoo: “klasse geh ich wieder pennen.”

    oder, statt immer nur zu pennen, vielleicht auch mal ein Buch lesen, zwischendurch? Oder vielleicht doch noch mal den Abschluß zum Homo erectus versuchen?

  3. #3 Lercherl
    12/07/2016

    Wie ist denn die Fehlerrate bei diesem Verfahren? Angenommen, ich bestimme 1000 SNPs: kann ich dann davon ausgehen, dass ich alle 1000 richtig und reproduzierbar bestimme? Bei 5000 Jahre alter Ötzi-DNA vermutlich weniger als bei sauberen Proben von Lebenden.

  4. #4 tomtoo
    12/07/2016

    @cornelius

    hör mal mein erectus geht dich mal garnix an.

    apropos buch .. so ein blog ist doch viel interaktiever.

    egal.

    können wir aus dem genom jetzt
    WAS herauslesen ?

    ?????

  5. #5 CM
    13/07/2016

    @Lercherl: Letztlich unterscheiden sich i.d.R. sogar Chargen der Firmen, die solche “Platten” herstellen. Doch gem https://bmcbioinformatics.biomedcentral.com/articles/10.1186/1471-2105-7-521 ist die Callrate (also der Anteil typisierter SNPs) bei 99.6% und die Concordanz (also der reproduzierbare Anteil*) bei 98.9% – das darf als Hausnummer für solche Tests aufgefasst werden. Der vorsichtige Wissenschaftler (mit Geld) überprüft ermittelt derartige Raten für jede Charge (also so gut wie nie 😉 ). Wenn man jetzt eine GWAS auswertet (üblicherweise mit Arrays oder NGS basiert, es werden also wesentlich mehr SNPs und auch andere Variationen erfasst) treibt man einiges an Statistik und Qualitätsmanagement, um das in den Griff zu bekommen.

    Letztlich enthalten GWAS-Publikationen immer auch eine Angabe zur Unschärfe der gemessenen bzw. per Metaanalyse gemittelten Risiken. Die müssten mit der Unschärfe der Tests konvolutiert werden. Das unterbleibt bei kommerziellen Anbietern.

    Bzgl. alter DNA: Die Fehlerrate bei guter DNA ist nicht per se schlechter als bei frischer DNA. Allerdings können meist weniger Positionen bestimmt werden. Anders sieht es aus, wenn die DNA stark degradiert ist. Dann wird die Statistik wesentlich komplexer und man ist oft gezwungen zu iterieren (moderne Referenz zu Kopplungsungleichgewicht bau eigener Referenzen). Ein Feld, in dem ich mich offengestanden wenig auskenne.

    *ungefähr

  6. #6 Cornelius Courts
    13/07/2016

    @Lecherl: “Wie ist denn die Fehlerrate bei diesem Verfahren? ”

    CM hat Dir in #5 ja schon einiges dazu gesagt. Allerdings stammen seine Zahlen aus einer 10 Jahre alten Studie. Die Technik ist inzwischen viel besser geworden, es gibt genauere Polymerasen, bessere Optik etc. Auch muß berücksichtigt werden, daß in der von mir beschriebenen Apex-Variante der SNP in beide Richtungen ausgelesen wird (sense und anti-sense Strang). Wenn diese beiden Ergebnisse nicht übereinstimmen, sieht man das sofort. Auch das reduziert die Fehlerrate nochmal deutlich. Ich kenne keine exakten Zahlen, schätze aber, daß die Fehlerrate bei diesem Verfahren wesentlich besser ist, als in der Studie von 2006.

    @tomtoo: “können wir aus dem genom jetzt WAS herauslesen ?”

    Nochmal der Tip: bevor Du Dich am Genomlesen versuchst, nimm doch lieber erstmal ein Buch. Mit kurzen Sätzen. Und großen Buchstaben. Und abwaschbaren Seiten.

  7. #7 CM
    13/07/2016

    @Cornelius: Zugegeben, ich bin nicht up to date. Doch https://www.ncbi.nlm.nih.gov/pubmed/19948333 sagt dieselben Zahlen. Etwas Neueres habe ich nicht finden können. Hast Du eine neuere Publikation? – interessieren würd’s mich schon.

  8. #8 Cornelius Courts
    13/07/2016

    @CM: “Hast Du eine neuere Publikation?”

    Nee, wie oben schon gesagt, habe ich leider keine Zahlen zur Fehlerrate, denke aber, daß die über die 10 Jahre deutlich besser geworden ist. Z.B. wegen Entwicklungen wie dieser hier (aus 2011): https://www.ncbi.nlm.nih.gov/pubmed/21294195