Dies ist ja der zweite “Ten simple rules”-Artikel, den ich kommentieren möchte. Geschrieben ist er von einer Gruppe von Leuten aus unterschiedlichen Orten geschrieben, die Eines eint: Sie arbeiten in Bioinformatik Service Projekten oder sogenannten “Core Facilities”. Und somit besteht ihre Tätigkeit – zumindest dem Titel – genau darin zu tun, worum es im Artikel…

Arbeitsgruppen lernen nicht. Einzelne Mitglieder vielleicht, aber Arbeitsgruppen haben Arbeitsweisen von denen sie sich schwer, wenn überhaupt, abbringen lassen. Das ist mein Résumé aus bislang 7 Jahren als universitärer Berater für wissenschaftliches Rechnen in den Lebenswissenschaften. Das ist zwar “nur” eine persönliche Erfahrung, aber wer Kuhn gelesen hat (also den Kuhn, nicht den Kuhn), den…

Ganz zu Anfang des Blogs hatte ich ja schon einmal angedeutet, dass ich einen Zusammenhang sehe zwischen schlechter Software und mangelnder Reproduzierbarkeit von wissenschaftlichen Aussagen. Das es um die Entwicklung von wissenschaftlicher Software, gerade in der Bioinformatik, nicht gut bestellt ist, habe ich ebenfalls behauptet. Und gleich im dritten Beitrag kam die Ten Years Reproducibility…

Kurz nach Start des Blogs erschien in Nature der Aufruf zur “Ten Years Reproducibility Challenge”. Ich habe darüber berichtet und auch zugegeben, dass bei eigener Software nicht immer gut um die Frage nach der Lauffähigkeit nach langer Zeit bestellt ist. Inzwischen gibt es bereits einige Rückläufer in Form von Veröffentlichungen zu einer ausgewählten Software, die…

Lange schon finde ich die Reihe “Ten simple rules for …” des Journals “PLOS COMPUTATIONAL BIOLOGY” amüsant. Ich lese sie gerne und ab und an gibt es Anregung zum Nachdenken – keineswegs sollte man annehmen, dass mit zehn einfachen Regeln ein beliebiges Thema allumfassend behandelt werden kann. Und so ist es auch nicht sinnvoll sich…

In meiner Sommerpause schrieb mir ein lieber Kollege, dass ihm zu “Klicken bis die Kurve stimmt” noch HARKing (Hypothesizing After the Results are Known)[Kerr, 1998] einfiele. Den Begriff hatte ich zwar schon ab und an gehört, schließlich habe ich PostDoc-Zeit unter Statistikern verbracht, aber habe ich wenig darüber nachgedacht zeigte mir ein anderer Artikel, dass…

Vor einer Weile hat ein Editor einer wissenschaftlichen Zeitschrift beschrieben was ihn umtreibt[Miyakawa, 2020]. Er hat eine besorgniserregende Beobachtung getätigt und – ganz guter Wissenschaftler – die Probe aufs Exempel gemacht, also Daten erhoben und beschrieben: Bei 41 zur Veröffentlichung eingereichten Artikeln war sein Editor-Impuls “This is too beautiful to be true.”. Folgerichtig hat er…

UAP – die “Universal Analysis Pipeline” wurde bereits im letzten Jahr als “Pipeline”-Lösung für Bioinformatik-workflows publiziert[Kämpf et al., 2019]. Für diesen Artikel ist wichtig zu verstehen, dass genomorientierte Bioinformatik (wie auch nahezu alle komplexe Datenanalytik) nahezu jederzeit bedeutet eine Analyse in eine Vielzahl von Schritten (z. B. – Achtung starke Vereinfachung – Qualitätsbestimmung, Qualitätskontrolle, Mapping,…

Die IT-affinen unter Euch wissen, was git ist. Für alle Anderen gaanz kurz: Es ist ein Versionsverwaltungssystem, mit dem Änderungen in Texten nachvollzogen werden könne. Man kann einen alten Zustand eines oder mehrerer Text wiederherstellen. Man kann einen Zustand “einfrieren” und als Version herausgeben (zu “versionieren“)- so kann man sich auch später wieder auf diese…

Zusammen mit Kollegen an anderen Einrichtungen bemerke ich immer wieder, dass nicht-IT-affine Universitätsarbeitsgruppen für bestimmte Projekte eine(n) BioinformatikerIn zu einer Masterarbeit oder Doktorat “anheuern”. Heraus kommt eine Software … Damit das hier ein konstruktiver Beitrag wird, brauchen wir ein Beispiel. Am besten ein schlechtes Beispiel, denn damit werden bestimmte Fehler augenfällig. Nehmen wir: Mich. Kleine…