Die Welt des winzig Kleinen

Chromosomen des Menschen unter dem Fluoreszenzmikroskop. (Bild von Steffen Dietzel, CC BY-SA 3.0)

Chromosomen des Menschen unter dem Fluoreszenzmikroskop. (Bild von Steffen Dietzel, CC BY-SA 3.0)

Könnt ihr euch ungefähr vorstellen wie groß ein Molekül ist? Zugegeben, es gibt natürlich Moleküle unterschiedlicher Größe. Ein menschliches Chromosom (also ein DNA-Molekül) ist im Durchschnitt ungefähr 4 Zentimeter lang. Ein Zucker-Molekül hingegen ist ungefähr 8 Ångström groß. Ein Ångström entspricht einer Länge von einem Zehnmilliardstel Meter. Das DNA-Molekül ist also etwa hundertmillionen Mal größer als das Zucker-Molekül. Das stimmt natürlich nur, wenn man die DNA “aufdröselt”. In gepackter Form ist ein Chromosom im Durchschnitt nur ungefähr 5 Mikrometer lang. So ein Chromosom kann man sich mit moderner Mikroskoptechnologie (Fluoreszenzmikroskopen oder Elektronenmikroskopen) sogar angucken.

Summenformel und Strukturformel von Zucker (Glukose).

Summenformel und Strukturformel von Zucker (Glukose).

Elektronenmikroskope haben eine deutlich höhere Auflösung als Lichtmikroskope. Mit einem Elektronenmikroskop sieht man Dinge im Nanometerbereich, wobei 0.000000001 Meter = 1 Nanometer = 10 Ångström. Unser 8 Ångström kleines Zuckermolekül ist also sogar für diese Technologie zu winzig. Trotzdem kennen wir die Struktur von Zucker. Und das schon bevor man überhaupt Elektronenmikroskope kannte. Wie kann das sein?

Die Struktur von Zuckermolekülen hat man ganz klassisch mittels chemischer Reaktionen bestimmt. Bestimmte Reaktionen deuten auf bestimmte chemische Gruppen im Molekül hin. Eine solche Analyse ist aufwendig und langwierig. Heute kennen wir da zum Glück andere Methoden: Mittels Kernspinresonanzspektroskopie kann man zum Beispiel die relativen Abstände der Wasserstoffatome im Molekül bestimmten. Bevor man die Anordnung der einzelnen Atome und deren Verbindungen untereinander überhaupt bestimmen kann, gilt es aber zuerst einmal herauszufinden: Was steckt drin, im Molekül?

Geld ist nicht alles, aber viel Geld ist schon etwas.

GeldwaageMachen wir einen kurzen Exkurs zu eurer Sparbüchse: Stellt euch vor ihr wollt wissen, wie viel Geld ihr besitzt, seid aber viel zu faul die Münzen zu zählen (es sind sehr sehr viele Münzen — ihr seid Dagobert Duck und eure Sparbüchse ist eigentlich ein Geldspeicher). Was könnt ihr tun? Schnappt euch einfach eine Waage! Jede Euro Münze hat ein bestimmtes Gewicht. Exakt wird eure Berechnung, wenn ihr die Münzen vorher sortiert. Aber wie gesagt, ihr seid faul (vermutlich seid ihr Informatiker). Also brauchen wir einen Algorithmus, der uns das gemessene Gewicht zerlegt, in die Anzahl der enthaltenen Münzen, sortiert nach Münzarten. Das zugrunde liegende Problem ist als Münzproblem bekannt. Dabei geht es eigentlich um Wechselgeld: Mit welchen Münzen lässt sich ein Betrag x herausgeben? Algorithmisch gesehen steckt dahinter das gleiche Problem, wie bei unserer Geldwaage, wobei Wechselgeldbetrag=Gewicht des gesamten Geldes, Münzbeträge=Gewicht der Münzen. Das Münzproblem gehört zu den Rucksackproblemen, einer Gruppe der klassischen NP-vollständigen Probleme aus der theoretischen Informatik.

Zurück zur Natur!

Vielleicht habt ihr schon gemerkt worauf ich hinaus will? Natürlich will ich kein Geld zählen, ich arbeite schließlich nicht in einer Bank, sondern bin Bioinformatikerin. Ich will die Zusammensetzung der Elemente in einem unbekannten Molekül herausfinden, also die Anzahl der Wasserstoff-, Kohlenstoffatome, usw. Oder anders gesagt, ich will die Summenformel des Moleküls herausfinden. Um Zucker zum Backen abzuwiegen mag meine Küchenwaage noch herhalten können, um ein einzelnes Zuckermolekül zu wiegen jedoch wohl kaum. Solche winzigen Massen lassen sich mittels Massenspektrometrie erfassen.

Ich hab jetzt also die Masse meines Moleküls (oder das Gewicht meines Münzbergs). Leider ist meine Lösung nicht immer eindeutig. Würde eine 2 Cent Münze 3 Gramm wiegen und eine 5 Cent Münze 6 Gramm, und meine Waage zeigt 6 Gramm an, dann weiß ich nicht, ob ich 4 oder 5 Cent besitze. Hinzu kommt, dass die Messtechnik nicht exakt ist und wir deswegen einen Fehlertoleranzbereich beachten müssen. Dadurch ergeben sich plötzlich extrem viele Zerlegungen (Summenformeln), die die ungenaue Masse erklären könnten.

Das Problem wird schwieriger, je mehr mögliche Elemente (oder Münzen) wir betrachten. Die häufigsten Elemente in der Natur sind Kohlenstoff, Wasserstoff, Stickstoff und Sauerstoff. Es gibt aber auch noch andere Elemente, die zwar seltener vorkommen, aber gerade für die Wirksamkeit von Medikamenten oft eine Rolle spielen, zum Beispiel Chlor, Brom oder Selen — und das sind längst noch nicht alle. Das Problem wird auch schwieriger, je schwerer das untersuchte Molekül ist, also je größer die Masse, die wir zerlegen müssen. Oft gibt es hunderttausende mögliche Zerlegungen. Woher weiß ich dann, welche die tatsächliche Summenformel des Moleküls ist?

Die Muster der Moleküle

Dafür verwendet man die Isotopenmuster der Moleküle. Die Elemente auf unserer Erde kommen in unterschiedlicher Form vor. Zwei Atome des gleichen Elements können unterschiedliche Anzahl an Neutronen enthalten, und haben somit ein unterschiedliches Gewicht. Zum Beispiel gibt es zwei stabile Isotopen von Wasserstoff: den “normalen” Wasserstoff (kein Neutron), und den schweren Wasserstoff (ein Neutron). Normaler Wasserstoff kommt auf unserem Planeten zu 99.985% vor, schwerer nur zu 0.015%. Durch die unterschiedliche Häufigkeit der Isotopen entsteht im Massenspektrum ein Muster — das Isotopenmuster. Je nach Anzahl der enthaltenen Elemente ändert sich dieses Muster. So kann man zwei Moleküle mit gleicher Masse aber unterschiedlicher Zusammensetzung voneinander unterscheiden.

Mittels bioinformatischer Methoden kann man das Isotopenmuster einer Summenformel simulieren. Vergleiche ich das Muster mit einer Messung meines unbekannten Moleküls, kann ich herausfinden, welche Summenformel die wahre Zusammensetzung des Moleküls ist. Natürlich macht das der Rechner, nicht ich — trotzdem: hunderttausende Isotopenmuster zu simulieren und zu vergleichen kostet Rechenzeit. Wie könnte ich Rechenzeit sparen? Zur Erinnerung: unser Problem wird schwieriger mit der Größe des Moleküls und mit der Anzahl der möglichen Elemente, die wir betrachten. Nun, an der Größe des Moleküls können wir wohl kaum etwas ändern, an der Anzahl der Elemente, die wir betrachten, vielleicht schon.

Elemente wie Chlor, Brom und Selenium haben charakteristische Isotopenmuster, die sich im Isotopenmuster des Moleküls widerspiegeln.

Elemente wie Chlor, Brom und Selenium haben charakteristische Isotopenmuster, die sich im Isotopenmuster des Moleküls widerspiegeln.

Was wäre, wenn ich schon vorher erraten könnte, welche Elemente sich sehr wahrscheinlich im Molekül befinden? Klar, Kohlenstoff, Wasserstoff, Stickstoff und Sauerstoff kommen in fast allen Molekülen vor, nehmen wir diese also als gesetzt. Wie sieht es mit Chlor, Brom oder Selen aus? Muss ich die Elemente überhaupt betrachten, wenn sie doch eh nur selten vorkommen? Einfach ausschließen können wir sie nicht. Aber — welch ein Glück — diese Elemente haben besonders auffällige Isotopenmuster. Die Muster sind sogar so prägnant, dass sie sich im Isotopenmuster des Moleküls widerspiegeln. Enthält mein Molekül Chlor, erkenne ich das von vornherein am gemessenen Muster. Und besser noch als ich selbst erkennen es Computer. Mittels Maschinellem Lernen können Computer vorhersagen, ob ein Molekül bestimmte seltene Elemente überhaupt enthalten kann.

Egal wie weit der Weg ist, man muss den ersten Schritt tun

Vielleicht habt ihr schon gemerkt, eine der großen Künste der Bioinformatik ist es, die biologischen Fragestellungen in die richtigen Teilprobleme zu zerlegen, die sich dann Schritt für Schritt lösen lassen. Zuerst bestimmen wir, was überhaupt drin sein kann im Molekül, dann bestimmen wir die genaue Zusammensetzung der Elemente und erst dann lohnt es sich zu untersuchen, wie die einzelnen Atome angeordnet sind. So gesehen, ist es auch heute noch ein langer Weg, um die Struktur eines Moleküls aufzuklären. Nur begeben wir uns nicht mehr zu Fuß auf diesen Weg, sondern eher in einer Rakete — und zwischendrin müssen wir ab und zu umsteigen.


Publikationen:


Beitrag auf BioinfoWelten lesen.

 

Kommentare (8)

  1. #1 Rotmilan
    20. Juli 2016

    Superartikel.

    Habe mich nur gefragt, ob andere Elemente, die vielleicht auch seltener sind, in entsprechend deutlichen Isotopenmuster in der MSM auftauchen oder ob Elemente wie Selen, Brom oder Chlor hier eine Ausnahme bilden…Kann man da “Überraschungen” erwarten oder weiß man nüchtern, wie wahrscheinlich Elemente auftauchen?

    Andere Frage:
    Es hieß, dass es komplizierter wird, je komplexer ein Molekül ist. Die hier dargestellten Moleküle sind ja recht überschaubar. Wie verhält sich denn bei großen Lipidmolekülen oder komplexen Proteinen?

    • #2 Franziska Hufsky
      20. Juli 2016

      Nicht alle Elemente, Phosphor zum Beispiel nur ein einziges stabiles Isotop. Das zeichnet sich nicht ab im Isotopenmuster des Moleküls. Man versuchten die Methode so zu trainieren, dass es man lieber mehr falsch Positive zulässt, als falsch Negative. Wenn das Element in Wirklichkeit gar nicht vorhanden ist, kann das dann noch immer in einem späteren Schritt erkannt werden. Wenn man es gleich wegschmeißt, dann nicht mehr.

      Die Methoden sind generell für “kleine Moleküle” bzw. Metaboliten. Für Proteine wendet man in der Regel ganz andere Methoden an, aufgrund ihrer kettenartigen Struktur und den wiederkehrenden Bausteinen.

  2. #3 Inge Schuster
    20. Juli 2016

    sorry, 1 Nanometer = 10 Angstrom

  3. #4 MJ
    21. Juli 2016

    Tut mir leid, aber 1A sind 10nm, nicht 1000.
    Mit guten Elektronenmikroskopen lassen sich durchaus molekulare Sechsringe auflösen.

  4. #5 MJ
    21. Juli 2016

    Mist, umgekehrt natürlich. 10A sind 1nm wollte ich sagen.

  5. #6 Franziska Hufsky
    21. Juli 2016

    @MJ & Inge: Danke für den Hinweis! Korrigiert 🙂

  6. #7 Kai
    23. Juli 2016

    @Rotmilan: Proteine bestehen ja aus einzelnen Aminosäuren. Daher setzt sich dein Münzalphabet nicht aus den chemischen Elementen zusammen, sondern aus den verschiedenen Aminosäuren. Und schon kannst du aus einer Masse des Proteins darauf schließen wie oft welche Aminosäure darin vorkommt. Ganz gut funktioniert das dann doch nicht, weil manche Aminosäuren die gleichen Massen haben (bsp: Leucin/Isoleucin). Und dann gibt es auch noch post-translationale Modifikationen (z.B. Methylierung), welche die Aminosäuren ändern. Zur genauen Bestimmung der Sequenz muss man dann aber Sequenzierungsmethoden verwenden.

    Lipide wiederum sind meines Wissens nach ja recht eingeschränkt, was die Zahl chemischer Elemente angeht. Generell macht es natürlich Sinn nicht nur eine, sondern mehrere Messtechniken zu benutzen und zu kombinieren. Man kann oft schon anhand einer Chromatographie viel über die Art des Moleküls erfahren um dann im zweiten Schritt die Möglichkeiten einzugrenzen.

  7. #8 Stephan
    29. November 2016

    MJ,
    bist du derjenige, dem im mai d.j. ein eingriff bevorstand ?