Weg mit der Überwachung
Entscheidungsbäume und Supportvektor-Maschinen gehören zu den überwachten Lernmethoden. Manchmal weiß man aber nicht, wie viele Klassen es eigentlich gibt, in die wir unsere Objekte einteilen wollen. Wir wollen einfach ähnliche Objekte zusammen sortieren und damit neue Gruppen finden. Es gibt zahlreiche Ansätze und Algorithmen, die sich mit dieser Aufgabe befassen. Generell spricht man von “Clustering”, wobei ein Cluster eine Art “Haufen” oder “Bündel” ist.
Machine Learning in der Biologie
Es gibt noch viele weitere Machine Learning Methoden, zum Beispiel künstliche neuronale Netze oder Probabilistische Graphische Modelle. Machine Learning ist cool. Machine Learning ist überall. Und Machine Learning ist natürlich auch Teil der Bioinformatik. Die Masse an biologischen Daten wächst und wächst. Nützliche Information aus dieser riesigen Menge an Daten zu filtern, fällt uns Menschen schwer, den Maschinen einfacher. Das liegt vor allem daran, dass Computer keine Regeln formulieren müssen, nach denen sie sortieren. Maschinelles Lernen wird mittlerweile in allen biologischen Bereichen angewendet: Genomik, Proteomik, Transkriptomik, Stammbaumforschung, … Von der ein oder anderen Anwendung habe ich euch schon berichtet und es folgen sicher noch weitere.
PS: So aus persönlichem Interesse: Welcher Typ Mountainbiker seid ihr?
Beitrag auf BioinfoWelten lesen.
Kommentare (9)