Ganz zu Anfang des Blogs hatte ich ja schon einmal angedeutet, dass ich einen Zusammenhang sehe zwischen schlechter Software und mangelnder Reproduzierbarkeit von wissenschaftlichen Aussagen. Das es um die Entwicklung von wissenschaftlicher Software, gerade in der Bioinformatik, nicht gut bestellt ist, habe ich ebenfalls behauptet. Und gleich im dritten Beitrag kam die Ten Years Reproducibility…

Kurz nach Start des Blogs erschien in Nature der Aufruf zur “Ten Years Reproducibility Challenge”. Ich habe darüber berichtet und auch zugegeben, dass bei eigener Software nicht immer gut um die Frage nach der Lauffähigkeit nach langer Zeit bestellt ist. Inzwischen gibt es bereits einige Rückläufer in Form von Veröffentlichungen zu einer ausgewählten Software, die…

Wenn ich mir Eines für den Nachgang zur SARS-CoV-2-Epedemie wünsche, ist es eine saubere epidemiologische Aufarbeitung. So eine mit allen Details. Mit nachvollziehbaren protokollierten Daten, an die man selber auch Fragen stellen kann. Grenzüberschreitend, damit auch vergleichende Detailanalysen möglich sind. Ab dem heutigen Tage habe ich so meine Zweifel, ob das möglich sein wird. Britische…

Lange schon finde ich die Reihe “Ten simple rules for …” des Journals “PLOS COMPUTATIONAL BIOLOGY” amüsant. Ich lese sie gerne und ab und an gibt es Anregung zum Nachdenken – keineswegs sollte man annehmen, dass mit zehn einfachen Regeln ein beliebiges Thema allumfassend behandelt werden kann. Und so ist es auch nicht sinnvoll sich…

Vor einer Weile hat ein Editor einer wissenschaftlichen Zeitschrift beschrieben was ihn umtreibt[Miyakawa, 2020]. Er hat eine besorgniserregende Beobachtung getätigt und – ganz guter Wissenschaftler – die Probe aufs Exempel gemacht, also Daten erhoben und beschrieben: Bei 41 zur Veröffentlichung eingereichten Artikeln war sein Editor-Impuls “This is too beautiful to be true.”. Folgerichtig hat er…

UAP – die “Universal Analysis Pipeline” wurde bereits im letzten Jahr als “Pipeline”-Lösung für Bioinformatik-workflows publiziert[Kämpf et al., 2019]. Für diesen Artikel ist wichtig zu verstehen, dass genomorientierte Bioinformatik (wie auch nahezu alle komplexe Datenanalytik) nahezu jederzeit bedeutet eine Analyse in eine Vielzahl von Schritten (z. B. – Achtung starke Vereinfachung – Qualitätsbestimmung, Qualitätskontrolle, Mapping,…

Die IT-affinen unter Euch wissen, was git ist. Für alle Anderen gaanz kurz: Es ist ein Versionsverwaltungssystem, mit dem Änderungen in Texten nachvollzogen werden könne. Man kann einen alten Zustand eines oder mehrerer Text wiederherstellen. Man kann einen Zustand “einfrieren” und als Version herausgeben (zu “versionieren“)- so kann man sich auch später wieder auf diese…

Zusammen mit Kollegen an anderen Einrichtungen bemerke ich immer wieder, dass nicht-IT-affine Universitätsarbeitsgruppen für bestimmte Projekte eine(n) BioinformatikerIn zu einer Masterarbeit oder Doktorat “anheuern”. Heraus kommt eine Software … Damit das hier ein konstruktiver Beitrag wird, brauchen wir ein Beispiel. Am besten ein schlechtes Beispiel, denn damit werden bestimmte Fehler augenfällig. Nehmen wir: Mich. Kleine…

Dieser Tage erreichte mich eine Mail – siehe Bild. So so, also die beliebtesten Artikel in “BMC Bioinformatics“. Nein, die Artikel, welche die meiste online-Aufmerksamkeit erregten. Das ist in der Tat etwas anderes. Was genau? Der Link zur Metric von Magic-Blast gibt Auskunft: Vielleicht bin ich ja ein zu alter Wissenschaftler, aber ich finde, liebe…

Die eiserne Regel in der Statistik (und eigentlich jeglicher experimenteller Wissenschaft): Erst planen, dann erheben, dann auswerten. Alles Andere führt zu einer langen Kette von Problemen, die man Studierenden von Naturwissenschaften seit langer Zeit in Grundpraktika vermittelt. Diese Überlegung steht auch hinter der Einrichtung statistischer “Stabs”-Institute an Universitätskliniken gibt (die auch eigene Forschung machen!), denn…