In meiner Sommerpause schrieb mir ein lieber Kollege, dass ihm zu “Klicken bis die Kurve stimmt” noch HARKing (Hypothesizing After the Results are Known)[Kerr, 1998] einfiele. Den Begriff hatte ich zwar schon ab und an gehört, schließlich habe ich PostDoc-Zeit unter Statistikern verbracht, aber habe ich wenig darüber nachgedacht zeigte mir ein anderer Artikel, dass…

Vor einer Weile hat ein Editor einer wissenschaftlichen Zeitschrift beschrieben was ihn umtreibt[Miyakawa, 2020]. Er hat eine besorgniserregende Beobachtung getätigt und – ganz guter Wissenschaftler – die Probe aufs Exempel gemacht, also Daten erhoben und beschrieben: Bei 41 zur Veröffentlichung eingereichten Artikeln war sein Editor-Impuls “This is too beautiful to be true.”. Folgerichtig hat er…

UAP – die “Universal Analysis Pipeline” wurde bereits im letzten Jahr als “Pipeline”-Lösung für Bioinformatik-workflows publiziert[Kämpf et al., 2019]. Für diesen Artikel ist wichtig zu verstehen, dass genomorientierte Bioinformatik (wie auch nahezu alle komplexe Datenanalytik) nahezu jederzeit bedeutet eine Analyse in eine Vielzahl von Schritten (z. B. – Achtung starke Vereinfachung – Qualitätsbestimmung, Qualitätskontrolle, Mapping,…

Die IT-affinen unter Euch wissen, was git ist. Für alle Anderen gaanz kurz: Es ist ein Versionsverwaltungssystem, mit dem Änderungen in Texten nachvollzogen werden könne. Man kann einen alten Zustand eines oder mehrerer Text wiederherstellen. Man kann einen Zustand “einfrieren” und als Version herausgeben (zu “versionieren“)- so kann man sich auch später wieder auf diese…

Zusammen mit Kollegen an anderen Einrichtungen bemerke ich immer wieder, dass nicht-IT-affine Universitätsarbeitsgruppen für bestimmte Projekte eine(n) BioinformatikerIn zu einer Masterarbeit oder Doktorat “anheuern”. Heraus kommt eine Software … Damit das hier ein konstruktiver Beitrag wird, brauchen wir ein Beispiel. Am besten ein schlechtes Beispiel, denn damit werden bestimmte Fehler augenfällig. Nehmen wir: Mich. Kleine…

Dieser Tage erreichte mich eine Mail – siehe Bild. So so, also die beliebtesten Artikel in “BMC Bioinformatics“. Nein, die Artikel, welche die meiste online-Aufmerksamkeit erregten. Das ist in der Tat etwas anderes. Was genau? Der Link zur Metric von Magic-Blast gibt Auskunft: Vielleicht bin ich ja ein zu alter Wissenschaftler, aber ich finde, liebe…

Die eiserne Regel in der Statistik (und eigentlich jeglicher experimenteller Wissenschaft): Erst planen, dann erheben, dann auswerten. Alles Andere hat führt zu einer langen Kette von Problemen, die man Studierenden von Naturwissenschaften seit langer Zeit in Grundpraktika vermittelt. Diese Überlegung steht auch hinter der Einrichtung statistischer “Stabs”-Institute an Universitätskliniken gibt (die auch eigene Forschung machen!),…

Besondere Zeiten sind dies. De facto findet die “International Supercomputing Conference” (ISC) in diesem Jahr ausschließlich online statt. Es ist DIE Konferenz im High Performace Computing (HPC)-Bereich in der unter anderem im halbjährlichen Wechsel mit ihrem amerikanischen Pendant die Liste der 500 schnellsten Supercomputer veröffentlicht wird. Eine Konferenz mit Messecharakter, vielen schaustellenden Firmen also. Aber…

Gerade lernen wir, dass Covid-19 wohl auch erhebliche Folgeschäden provozieren kann. Beispielsweise kann das SARS-CoV-2-Virus die Nieren stark schädigen [Puelles et al., 2020], mögliche Lähmungen des Atemsystems verursachen und macht vor der Psyche nicht halt[Rogers et al., 2020]. Vor allem aber kann es auch starke Schädigungen der Lungen geben[Ye et al., 2020] – was wir…

Wer könnte meinen “schlechte Werkzeuge (in der Bioinformatik)”-Rant besser fortsetzen als Randall Munroe mit dem aktuellen xkcd-Comic? Nein, keine Angst: Sooo läuft Bioinformatik tatsächlich nicht ab. Das Comic übertreibt vollkommen. Und doch … Anwendung von allgemeinen Programmen, die nie für die Aufgabe gedacht waren, für die sie verwendet werden? Das kommt schon vor und wird…