Von Mäusen, Bäumen, Viren und Co.

Von Franziska Hufsky / 18. Juni 2016 / 30 Kommentare

Was haben ausgerechnet Mäuse, Bäume und Viren mit Bioinformatik zu tun? Sollte ich nicht eher von DNA, Menschen, Krebs und Algorithmen reden? Gucken wir uns die Begriffe doch mal genauer an:

Die Maus: (Mus musculus) weltweit verbreitetes kleines Nagetier.
Die Maus: Standardeingabegerät für den Computer.
Der Baum: verholzte Pflanze, bestehend aus Wurzel, Stamm und Krone.
Der Baum: spezieller Graph, der zusammenhängend ist und keine geschlossenen Pfade enthält.
Das Virus: infektiöser Partikel, der sich nur innerhalb einer Wirtszelle vermehren kann.
Das Virus: sich selbst verbreitendes Computerprogramm, welches sich in andere Computerprogramme einschleust und reproduziert.

Habt ihr es erkannt? Maus, Baum und Virus sind Begriffe, die sowohl in der Biologie als auch in der Informatik eine Bedeutung haben. Sie stehen für mich stellvertretend für die Verbindung zweier Welten.

Die Verbindung zweier Welten

Warum heißt die Computermaus eigentlich Maus? Ursprünglich wurden Mäuse noch per Kabel mit dem Computer verbunden. Die Form der Computermaus in Verbindung mit dem Kabel erinnerten einfach stark an das kleine Nagetier. Warum nennen die Informatiker eine Gruppe von Graphen Bäume? Zu diesen speziellen Graphen zählen zum Beispiel Stammbäume — das sind natürlich keine echten Bäume, sondern eher eine Darstellung der evolutionären Abstammungsgeschichte. Aber wie bei einem Baum, gibt es auch in einem Stammbaum eine Wurzel und Verzweigungen bishin zu den Blättern: das sind wir selbst. Und warum spricht man von einem Computervirus? Viren dienen nur ihrer eigenen Vermehrung in einer fremden Wirtszelle und können dabei (versehentlich) Schaden anrichten. Das gleiche gilt auch für einen Computervirus. Nur dass der Schaden dabei wohl eher beabsichtigt ist.

Biologie in Informatik umsetzen, durch Informatik die Biologie vorantreiben, uns aus der Biologie Ideen für die Informatik ziehen — genau diese Denkweisen sind es, die man als Bioinformatiker erlernen muss. Biologie und Informatik haben viel mehr gemeinsam, als einem im ersten Moment bewusst ist. Neben Maus, Baum und Virus, gibt es viele Ideen und Konzepte, die sowohl in der Informatik als auch der Biologie eine Bedeutung haben. Lasst mich euch zwei kleine Beispiele geben:

Unser Gehirn im Computer

Das neuronale Netzwerk des Fadenwurms.
(Von Mentatseb, CC BY-SA 3.0)

Die Nervenzellen (Neuronen) in unserem Gehirn sind über Synapsen miteinander verknüpft und bilden ein Netzwerk. So können sich die Neuronen miteinander austauschen und Informationen als Signale weiterleiten. Eine Nervenzellen hat üblicherweise mehrere eingehende Nervenzellen und einen Ausgang. Kriegt die Nervenzelle genügend Eingangssignal, leitet sie ein Ausgangssignal weiter. Solche neuronalen Netze ermöglichen es, komplexe Muster zu lernen. Und zwar nicht nur in unserem Gehirn, sondern auch im Computer. Solche künstlichen neuronalen Netze werden zum Beispiel für maschinelle Gesichtserkennung verwendet. Genau wie unser Gehirn müssen auch die künstlichen Netze trainiert werden. Dann können sie aber Großes leisten. AlphaGo, das erste Computerprogramm, dass es geschafft einen Menschen im Go spielen zu schlagen, beruht auf einem künstlichen neuronalen Netz.

Omnia casu fiunt (Alles ist das Werk des Zufalls)

Zufall spielt in der Biologie eine riesige Rolle. Die Grundlage der Evolution, nämlich Mutationen, die zu Veränderungen in unserem Erbgut führen, sind zufällig. Ereignisse sind zufällig, wenn es keine Ursache als Erklärung für das Ereignis gibt. Mutationen haben zwar durchaus eine Ursache (zum Beispiel UV-Strahlung), das Zusammentreffen der Ereignisse ist aber zufällig. In der Informatik gibt es Algorithmen, die den Zufall nutzen um schwer lösbare Probleme bewältigen zu können. Schwer lösbare Probleme zeichnen sich vor allem dadurch aus, dass die Algorithmen extrem lange rechnen, um zu einer Lösung zu kommen. In dem man zufällige Schritte in den Algorithmus einbaut, kann man auf zwei Wegen Abhilfe schaffen: man verzichtet unter Umständen auf die ganz exakte Lösung oder aber man hat zufällig Glück (oft) und der Algorithmus ist schnell oder Pech (selten) und der Algorithmus ist langsam.

Das sind nur zwei Beispiele für Prinzipien, die sich Biologie und Informatik teilen. Es gibt noch viel mehr solcher Prinzipien und Ideen, die sich die eine Wissenschaft von der anderen abschauen kann. Die große Kunst der Bioinformatik ist es, beide Disziplinen zusammenzuführen und dadurch beide Wissenschaften voranzutreiben.

Kommentare (30)

#1 michael
18. Juni 2016

Eine neuer Blog. Und mit einem interessanten Thema.
#2 Laie
18. Juni 2016

Die unterschiedliche Wirkung zwischen exhibitorischer und inhibitorischer Verschaltung ist gerade beim Auge von Bedeutung, und fasziniert mich. Werden inhibitorische Verschaltung auch in der Mustererkennung in der KI verwendet?

Der programmierte Zufall will’s, dass solche (Näherungs- oder Berechnungs-) Verfahren schneller was finden, und das ganz zum Entsetzen mancher Mathematiker, die Wert auf den reproduzierbaren Zufall legen. Klingt lustig, ist aber so! 🙂

Dass der Zufall von anderer Seite Einzug in die Informatik finden wird, durch kleinere Strukturbreite + kosmischer Strahlung lässt die Bitfehlerrate und somit Spannung auch von anderer Seite her steigen.

Mal schaun, was so werden wird.
#3 rolak
18. Juni 2016

Schaden dabei wohl eher beabsichtigt

Sicherlich, doch offensichtliche Schäden sind es nur bei Erpressungs- oder SabotageAbsicht, im Falle eines versuchten gepflegten, längerfristigen Ausschnüffelns wäre jedwege Auffälligkeit final kontraproduktiv.

Bin schon gespannt auf die kommenden Texte!
#4 MisterX
18. Juni 2016

Sehr interessant. Obwohl man hier auch den Vergleich zwischen menschlichem Gehirn und Computer machen müsste. Gehirn -> biologischer Computer, obwohl ich dafür jetzt keine gleichen Wörter finden kann.
#5 Johann
18. Juni 2016

Virus, war da der Unterschied zwischen Natur und Informatik, daß es in dem einen Fall der Virus, im anderen das Virus heißt? 😉
- #6 Franziska Hufsky
  20. Juni 2016
  
  Eigentlich heißt es in beiden Fällen “das Virus”; “der Virus” ist eher Umgangssprache.
#7 LasurCyan
18. Juni 2016

Schwer lösbare Probleme zeichnen sich vor allem dadurch aus, dass die Algorithmen extrem lange rechnen, um zu einer Lösung zu kommen.

So verallgemeinert kann ich mir nur schwer vorstellen, ob die Probleme, die es zu berechnen gilt, zu komplex für die Algorithmen sind oder die Algorithmen einfach zu komplex für die Maschinen sind. Oder beides. Inwiefern da Zufall (echte ZufallsZahlen?) die Prozedur vereinfachen können, verstehe ich nicht so recht. Könntest Du ein konkretes Beispiel bringen?
#8 LasurCyan
18. Juni 2016

Noch was vollkommen praktisches: Das eMailAbo für die nachfolgenden Kommentare ist (noch) nicht möglich. Ich würde gern typischerweise das Häkchen in das Kästchen klicken^^
#9 Ernst der Lage
18. Juni 2016

Ich freue mich auf diesen Blog!
#10 sternschnuppe
19. Juni 2016

“Genau wie unser Gehirn müssen auch die künstlichen Netze trainiert werden. Dann können sie aber Großes leisten”
Wie zufällig sind denn Algorithmen, wenn die Zufälligkeit von Außen eingegeben wird ? Ist es Zufall oder einprogrammierte Varianz ? Wie unterscheidet man, dass Algorithmen richtig sind das Ergebnis aber trotzdem falsch ist von falschen Algorithmen, die aber ein erwartbares Ergebnis liefern ?
Sind Halluzinationen falsche Informationen ?
#11 Jürgen Schönstein
19. Juni 2016

Willkommen bei den ScienceBlogs!
#12 f
19. Juni 2016

ich befinde mich in de0r

moderation
#13 Florian Freistetter
19. Juni 2016

Herzlich Willkommen bei den Science Blogs! Ich hoffe, du hast hier viel Spaß!
#14 MartinB
19. Juni 2016

Herzlich willkommen auch von mir.
#15 Braunschweiger
19. Juni 2016

Ein herzliches Hallo auch von mir als einfachem und purem Leser!

Das Thema Bioinformatik interessiert mich, vor allem auch im Zusammenhang mit der Möglichkeit von Simulationen — sowohl Sims für die Biologie, als auch, was Simulationstechnik von der Biologie lernen kann. Noch interessanter mag vielleicht die Fragestellung sein, wie Bioinformatik in Kooperation mit anderen Fächern in Zukunft unser Leben und unsere Wirtschaft bestimmen wird.

Für den Anfang hat mich das Beispiel mit den Neuronalen Netzen am ehesten überzeugt. Hier hat wirklich die Informatik von der Natur abgeschaut. Bei der Hervorhebung des Zufalls in der Evolution (und an anderen Stellen) würde ich aber gerne daneben stellen, dass dies nur im Zusammenspiel mit einem starken Mechanismus für Bewertung und Selektion funktioniert.

Bin gespannt, was uns die Blogthemen demnächst bieten werden! ;-).
#16 Joseph Kuhn
19. Juni 2016

Herzlich willkommen und viel Spaß!
#17 LasurCyan
19. Juni 2016

Das hatte ich, vollkommen im Thema versunken, völlig vergessen: Herzlich willkommen! Bin gespannt..

PS: Das mailAbo gibt’s ja inzwischen^^
#18 Kai
20. Juni 2016

Hi,

@LasurCyan: Im Grunde genommen sind erstmal alle “Maschinen” gleichmächtig. Es gibt also keine Algorithmen, die zu komplex für eine Maschine sind (zumindest soweit die Theorie). Aber natürlich können manche Maschinen bestimmte Probleme unterschiedlich schnell lösen (Beispiele: Quantencomputer, DNA-Computer, …).
In der Regel bezieht man sich ja aber auf unseren klassischen Computer. Will man die Komplexität eines Problems erfassen, so fragt man wie viel Zeit ein Programm abhängig von der Größe seiner Eingabe braucht. Ein Programm ist z.B. linear, wenn es für eine doppelt so große Eingabe auch doppelt so viel Zeit braucht. Es ist quadratisch, wenn es für eine doppelt so große Eingabe vier Mal so viel Zeit braucht. Richtig knifflig sind oft Probleme, die exponentielle Laufzeit haben, also die doppelt so viel Zeit brauchen sobald ich das Problem um 1 vergrößere.

Wie kann jetzt der Zufall beim Lösen solcher Probleme helfen? Angenommen ich habe einen Zufallsalgorithmus, der zwar sehr schnell ist, mir aber nur mit 50%er Wahrscheinlichkeit die richtige Antwort liefert. Ist erstmal nicht viel. Wenn ich aber den Algorithmus zwei Mal ausführe, habe ich bereits mit 75% Wahrscheinlichkeit die richtige Antwort. Nach 10 Mal ausführen habe ich mit 99,9% die richtige Antwort. Manchmal sind solche Zufallsbasierten Algorithmen immer noch schneller als ein exakter Algorithmus, selbst wenn man sie 100 Mal ausführt und dadurch die Fehlerwahrscheinlichkeit extrem klein macht. Weiterhin gibt es Algorithmen, die für bestimmte Eingaben extrem langsam werden. Zufallsbasierte Algorithmen minimieren solche Gefahren.

@Laie: Es gibt keine inhibitorischen künstlichen Neuronen, aber jede Verschaltung kann anregend oder hemmend wirken. Früher hat man da auch keinen Unterschied gemacht, das Signal war halt entweder positiv oder negativ. Interessanterweise hat man mittlerweile herausgefunden, dass neuronale Netze wesentlich besser funktionieren, wenn Neuronen durch hemmende Signale auch abgeschaltet werden können, wie es im Gehirn ja auch der Fall ist (hat auch einen mathematischen Hintergrund. Aber es ist immer interessant diese Parallelen zur Biologie zu sehen).
#19 rolak
20. Juni 2016

Mus musculus

Ganz am Rande: warum heißt die eigentlich so? Gibts auch noch die ´Mus ovum mollis´ als Gegenpart?
- #20 Franziska Hufsky
  20. Juni 2016
  
  Im Sinne von “Weichei”? 😀 Nicht dass ich wüsste. Würde ich mir aber sofort anschaffen 😉
- #21 rolak
  20. Juni 2016
  
  Im Sinne von
  
  Ja klar, Franziska, kodiert in der Weltsprache Küchenlatein ;‑)
  Was auch immer, sooo muskulös ist doch kein Mäuslein (außer Monty).
  
  Das eingangs angesprochen Gespanntsein beruht, wie sträflicherweise vergessen wurde zu erwähnen, selbstverständlich auf dem ungemein appetitanregenden Eröffnungs-post. Willkommen!
#22 Marcus Anhäuser
20. Juni 2016

Ein neuer Blog! Herzlich willkommen! 🙂
#23 schlappohr
20. Juni 2016

Ich muss zugeben, dass ich von Bioinformatik bisher eine völlig falsche Vorstellung hatte. Ich dachte tatsächlich, es ginge dabei um “Bio-Chips”, organische Computer, elektronische Implantate etc.

Vor einigen Jahren habe ich am Rande an einem Forschungsprojekt mitgearbeitet, bei dem es darum ging, wie man Algorithmen effizient auf ein Computersystem bringt, das aus vielen heterogenen Prozessoren, Speichern, Bussen und I/O-Komponenten besteht (z.B. System-on-Chip). Dieses Problem ist im Allgemeinen so komplex, dass keine beweisbar optimale Lösung gefunden werden kann. Wir haben zunächst genetische Algorithmen und später Partikelschwarmoptimierung verwendet, um zu einer Menge von Lösungen zu gelangen, die in gewisser Hinsicht “effizient” sind, also z.B. besser als eine reine Zufallslösung oder bestimmte Kriterien erfüllen (Energieverbrauch, Geschwindigkeit, Speicherbedarf). Das war also dann streng genommen auch ein Problem der Bioinformatik, obwohl es niemand so genannt hat. Es ist faszinierend, dass natürliche Prozesse, die nach extrem einfachen Regeln funktionieren, Lösungen für derart komplizierte Probleme liefern können.
#24 Franziska Hufsky
20. Juni 2016

Danke für die vielen Willkommensgrüße, das Interesse an meinem Blog, die vielen interessanten Fragen und bereits gegebenen Antworten! Eure Fragen haben mich schon zu neuen Themenideen inspiriert. Ich freue mich auf zukünftige spannende Diskussionen und Ideen!
#25 Bettina Wurche
20. Juni 2016

Willkommen in unserer Blogosphäre, Franziska!
Interessanter Themenbereich.
#26 Cornelius Courts
21. Juni 2016

Extrem interessantes Thema/Themenfeld, an dem ich auch beruflich sehr interessiert bin!

Herzlich willkommen hier 🙂
#27 user unknown
https://demystifikation.wordpress.com/2015/06/21/mengenlehre/
23. Juni 2016

Auch von mir ein Willkommen!

@LasurCyan, #7:
Ich könnte ein Beispiel beisteuern.

Populär in der Informatik ist das Problem des Handlungsreisenden. Man hat beispielsweise 4 Punkte(x,y) in einer Ebene und muss die kürzeste Route finden, die von A über die anderen Punkte zurück zu A führt – A, B, C, D, A oder A, C, B, D, A, wobei hier die Richtung des Weges egal sein soll, also A, D, C, B, A wäre das gleiche wie der erste Weg.

Bei 3 Punkten gibt es also nur einen Weg (ABC=ACB, das abschließende A in der Notation unterschlagend) und auch der Startpunkt ist hier egal (ABC=BCA) weil immer geschlossene Kreise angenommen werden.

Mit 4 Punkten hat man also 2 Möglichkeiten, bei 5 Punkten 2*3, bei sechs Punkten 2*3*4 usw., so dass die Zahl möglicher Wege quasi explodiert, je mehr Punkte zu besuchen sind.

Für 22 Punkte kommt man schon auf 2432902008176640000 mögliche Routen.

Man kann aber 3 Punkte zufällig auswählen, die eine in sich optimale Route bilden, und dann von den 19 verbliebenen einen zufälligen Punkt dazuwählen, und diesen optimal in die existierende Route einpassen, also an 2 Stellen. Dann den nächsten Punkt, den man an 3 Stellen probiert usw. Das sind nur 2+3+4+..+19 Berechnungen insgesamt.

Wenn man diese Prozedur 10, 20, 1000 mal wiederholt kommt man jeweils auf eine andere Lösung, weil man nur ein lokales Optimum findet. Aber die beste der 1000 Routen ist schon recht nahe an einer insgesamt optimalen Lösung. 1000*20 Routen zu berechnen ist ein Klacks, verglichen mit den 2*10 hoch 18 Routen, die es tatsächlich gibt.
#28 Laie
24. Juni 2016

Ach ja, das Beispiel von Herrn Wagner ist auch wieder so ein schönes Lehrbuchbeispiel, das so gar nicht in die reale Welt passt. Ist ja alles wieder abhängig von der aktuellen Verkehrslage, ob ein Kunde absagt, und außerdem stehen die Punkte so nicht fest, da ja der Zeitpunkt ausgemacht wird, also man kann nicht einfach irgenwo aufkreuzen und sagen “Huhu, da bin ich”, nein man muß im realen Leben Zeitpunkte einhalten.

Solange man Theorie und Praxis zu unterscheiden im Stande ist, sind Lehrbuchbeispiele auch wieder nicht so schlecht.
#29 user unknown
https://demystifikation.wordpress.com/2016/06/25/critical-mass-bericht/
27. Juni 2016

@Laie: Die Punkte, die besucht werden, können auch Schweißpunkte für einen Roboter sein, die dieser anfährt, und damit unabhängig von Verkehrslagen und Verabredungen.
#30 Laie
29. Juni 2016

Gutes Gegenargument, bei Schweißpunkten ist es relevant.

Möglicherweise spielen dort für die Reihenfolge der Abarbeitung die Konstruktion selbst, wie zuerst weitverteilt zu Schweißen und später innenliegende Punkte, um eine möglichst gleiche Kraftaufteilung auf allen Berührungspunkten zu bekommen, eine wesentliche Rolle?

Von Mäusen, Bäumen, Viren und Co.

Die Verbindung zweier Welten

Unser Gehirn im Computer

Omnia casu fiunt (Alles ist das Werk des Zufalls)

Kommentare (30)

Über die Autorin

Über das Blog

Themen-Reihen

Fragen

Top Beiträge

Letzte Kommentare

Von Mäusen, Bäumen, Viren und Co.

Die Verbindung zweier Welten

Unser Gehirn im Computer

Omnia casu fiunt (Alles ist das Werk des Zufalls)

Kommentare (30)

Abonnieren

Über die Autorin

Über das Blog

Themen-Reihen

Fragen

Top Beiträge

Letzte Kommentare