Die Welt des winzig Kleinen
Könnt ihr euch ungefähr vorstellen wie groß ein Molekül ist? Zugegeben, es gibt natürlich Moleküle unterschiedlicher Größe. Ein menschliches Chromosom (also ein DNA-Molekül) ist im Durchschnitt ungefähr 4 Zentimeter lang. Ein Zucker-Molekül hingegen ist ungefähr 8 Ångström groß. Ein Ångström entspricht einer Länge von einem Zehnmilliardstel Meter. Das DNA-Molekül ist also etwa hundertmillionen Mal größer als das Zucker-Molekül. Das stimmt natürlich nur, wenn man die DNA “aufdröselt”. In gepackter Form ist ein Chromosom im Durchschnitt nur ungefähr 5 Mikrometer lang. So ein Chromosom kann man sich mit moderner Mikroskoptechnologie (Fluoreszenzmikroskopen oder Elektronenmikroskopen) sogar angucken.
Elektronenmikroskope haben eine deutlich höhere Auflösung als Lichtmikroskope. Mit einem Elektronenmikroskop sieht man Dinge im Nanometerbereich, wobei 0.000000001 Meter = 1 Nanometer = 10 Ångström. Unser 8 Ångström kleines Zuckermolekül ist also sogar für diese Technologie zu winzig. Trotzdem kennen wir die Struktur von Zucker. Und das schon bevor man überhaupt Elektronenmikroskope kannte. Wie kann das sein?
Die Struktur von Zuckermolekülen hat man ganz klassisch mittels chemischer Reaktionen bestimmt. Bestimmte Reaktionen deuten auf bestimmte chemische Gruppen im Molekül hin. Eine solche Analyse ist aufwendig und langwierig. Heute kennen wir da zum Glück andere Methoden: Mittels Kernspinresonanzspektroskopie kann man zum Beispiel die relativen Abstände der Wasserstoffatome im Molekül bestimmten. Bevor man die Anordnung der einzelnen Atome und deren Verbindungen untereinander überhaupt bestimmen kann, gilt es aber zuerst einmal herauszufinden: Was steckt drin, im Molekül?
Geld ist nicht alles, aber viel Geld ist schon etwas.
Machen wir einen kurzen Exkurs zu eurer Sparbüchse: Stellt euch vor ihr wollt wissen, wie viel Geld ihr besitzt, seid aber viel zu faul die Münzen zu zählen (es sind sehr sehr viele Münzen — ihr seid Dagobert Duck und eure Sparbüchse ist eigentlich ein Geldspeicher). Was könnt ihr tun? Schnappt euch einfach eine Waage! Jede Euro Münze hat ein bestimmtes Gewicht. Exakt wird eure Berechnung, wenn ihr die Münzen vorher sortiert. Aber wie gesagt, ihr seid faul (vermutlich seid ihr Informatiker). Also brauchen wir einen Algorithmus, der uns das gemessene Gewicht zerlegt, in die Anzahl der enthaltenen Münzen, sortiert nach Münzarten. Das zugrunde liegende Problem ist als Münzproblem bekannt. Dabei geht es eigentlich um Wechselgeld: Mit welchen Münzen lässt sich ein Betrag x herausgeben? Algorithmisch gesehen steckt dahinter das gleiche Problem, wie bei unserer Geldwaage, wobei Wechselgeldbetrag=Gewicht des gesamten Geldes, Münzbeträge=Gewicht der Münzen. Das Münzproblem gehört zu den Rucksackproblemen, einer Gruppe der klassischen NP-vollständigen Probleme aus der theoretischen Informatik.
Zurück zur Natur!
Vielleicht habt ihr schon gemerkt worauf ich hinaus will? Natürlich will ich kein Geld zählen, ich arbeite schließlich nicht in einer Bank, sondern bin Bioinformatikerin. Ich will die Zusammensetzung der Elemente in einem unbekannten Molekül herausfinden, also die Anzahl der Wasserstoff-, Kohlenstoffatome, usw. Oder anders gesagt, ich will die Summenformel des Moleküls herausfinden. Um Zucker zum Backen abzuwiegen mag meine Küchenwaage noch herhalten können, um ein einzelnes Zuckermolekül zu wiegen jedoch wohl kaum. Solche winzigen Massen lassen sich mittels Massenspektrometrie erfassen.
Ich hab jetzt also die Masse meines Moleküls (oder das Gewicht meines Münzbergs). Leider ist meine Lösung nicht immer eindeutig. Würde eine 2 Cent Münze 3 Gramm wiegen und eine 5 Cent Münze 6 Gramm, und meine Waage zeigt 6 Gramm an, dann weiß ich nicht, ob ich 4 oder 5 Cent besitze. Hinzu kommt, dass die Messtechnik nicht exakt ist und wir deswegen einen Fehlertoleranzbereich beachten müssen. Dadurch ergeben sich plötzlich extrem viele Zerlegungen (Summenformeln), die die ungenaue Masse erklären könnten.
Das Problem wird schwieriger, je mehr mögliche Elemente (oder Münzen) wir betrachten. Die häufigsten Elemente in der Natur sind Kohlenstoff, Wasserstoff, Stickstoff und Sauerstoff. Es gibt aber auch noch andere Elemente, die zwar seltener vorkommen, aber gerade für die Wirksamkeit von Medikamenten oft eine Rolle spielen, zum Beispiel Chlor, Brom oder Selen — und das sind längst noch nicht alle. Das Problem wird auch schwieriger, je schwerer das untersuchte Molekül ist, also je größer die Masse, die wir zerlegen müssen. Oft gibt es hunderttausende mögliche Zerlegungen. Woher weiß ich dann, welche die tatsächliche Summenformel des Moleküls ist?
Die Muster der Moleküle
Dafür verwendet man die Isotopenmuster der Moleküle. Die Elemente auf unserer Erde kommen in unterschiedlicher Form vor. Zwei Atome des gleichen Elements können unterschiedliche Anzahl an Neutronen enthalten, und haben somit ein unterschiedliches Gewicht. Zum Beispiel gibt es zwei stabile Isotopen von Wasserstoff: den “normalen” Wasserstoff (kein Neutron), und den schweren Wasserstoff (ein Neutron). Normaler Wasserstoff kommt auf unserem Planeten zu 99.985% vor, schwerer nur zu 0.015%. Durch die unterschiedliche Häufigkeit der Isotopen entsteht im Massenspektrum ein Muster — das Isotopenmuster. Je nach Anzahl der enthaltenen Elemente ändert sich dieses Muster. So kann man zwei Moleküle mit gleicher Masse aber unterschiedlicher Zusammensetzung voneinander unterscheiden.
Mittels bioinformatischer Methoden kann man das Isotopenmuster einer Summenformel simulieren. Vergleiche ich das Muster mit einer Messung meines unbekannten Moleküls, kann ich herausfinden, welche Summenformel die wahre Zusammensetzung des Moleküls ist. Natürlich macht das der Rechner, nicht ich — trotzdem: hunderttausende Isotopenmuster zu simulieren und zu vergleichen kostet Rechenzeit. Wie könnte ich Rechenzeit sparen? Zur Erinnerung: unser Problem wird schwieriger mit der Größe des Moleküls und mit der Anzahl der möglichen Elemente, die wir betrachten. Nun, an der Größe des Moleküls können wir wohl kaum etwas ändern, an der Anzahl der Elemente, die wir betrachten, vielleicht schon.
Was wäre, wenn ich schon vorher erraten könnte, welche Elemente sich sehr wahrscheinlich im Molekül befinden? Klar, Kohlenstoff, Wasserstoff, Stickstoff und Sauerstoff kommen in fast allen Molekülen vor, nehmen wir diese also als gesetzt. Wie sieht es mit Chlor, Brom oder Selen aus? Muss ich die Elemente überhaupt betrachten, wenn sie doch eh nur selten vorkommen? Einfach ausschließen können wir sie nicht. Aber — welch ein Glück — diese Elemente haben besonders auffällige Isotopenmuster. Die Muster sind sogar so prägnant, dass sie sich im Isotopenmuster des Moleküls widerspiegeln. Enthält mein Molekül Chlor, erkenne ich das von vornherein am gemessenen Muster. Und besser noch als ich selbst erkennen es Computer. Mittels Maschinellem Lernen können Computer vorhersagen, ob ein Molekül bestimmte seltene Elemente überhaupt enthalten kann.
Egal wie weit der Weg ist, man muss den ersten Schritt tun
Vielleicht habt ihr schon gemerkt, eine der großen Künste der Bioinformatik ist es, die biologischen Fragestellungen in die richtigen Teilprobleme zu zerlegen, die sich dann Schritt für Schritt lösen lassen. Zuerst bestimmen wir, was überhaupt drin sein kann im Molekül, dann bestimmen wir die genaue Zusammensetzung der Elemente und erst dann lohnt es sich zu untersuchen, wie die einzelnen Atome angeordnet sind. So gesehen, ist es auch heute noch ein langer Weg, um die Struktur eines Moleküls aufzuklären. Nur begeben wir uns nicht mehr zu Fuß auf diesen Weg, sondern eher in einer Rakete — und zwischendrin müssen wir ab und zu umsteigen.
Publikationen:
- M. Meusel, F. Hufsky, F. Panter, D. Krug, R. Müller, and S. Böcker
Predicting the presence of uncommon elements in unknown biomolecules from isotope patterns
Anal Chem, 2016 - S. Böcker and Z. Lipták
Efficient mass decomposition.
In Proceedings of the 2005 ACM symposium on Applied computing (SAC ’05), 151-157, 2015.
Beitrag auf BioinfoWelten lesen.
Kommentare (8)