Wer könnte meinen “schlechte Werkzeuge (in der Bioinformatik)”-Rant besser fortsetzen als Randall Munroe mit dem aktuellen xkcd-Comic?

Nein, keine Angst: Sooo läuft Bioinformatik tatsächlich nicht ab. Das Comic übertreibt vollkommen. Und doch … Anwendung von allgemeinen Programmen, die nie für die Aufgabe gedacht waren, für die sie verwendet werden? Das kommt schon vor und wird demnächst bestimmt mal wieder Thema. explainxkcd bemerkt dazu:

Megan might be better served by using a diff tool, but most scientists are generally not experienced computer programmers or system administrators, and often do use mainstream tools to do tasks that could be done much more efficiently in a more esoteric way.

esoteric way??? Nee, da bin ich doch nicht einer Meinung mit dem Autor dort: Denn wer algorithmisch beschreiben kann, was gemacht wurde, hat den ersten Schritt zur Reproduzierbarkeit getan. Zugefügt am 28. April 2020: diff-tools, so wie im Zitat angedeutet finden bei Sequenzvergleichen keine Verwendung. Vor Vergleichen stehen sogenannte Alignments; es wird zwischen lokalen und globalen Alignments unterschieden – die abhängig von der Fragestellung eingesetzt werden. Esoterisch sind diese Programme nicht – wohl aber manches Mal die Diskussion, welches Programm das “Beste” sei. (Ende der Änderung)

Ach, und der tiefere Witz für die mitlesenden Bioinformatiker ist natürlich beim title text:

Spellcheck has been great, but whoever figures out how to get grammar check to work is guaranteed a Nobel.

Die tiefere Bedeutung einer Sequenz(änderung) herausfinden – das ist Wissenschaft! Und wer das automatisiert hat den heiligen Gral gefunden. Viel Erfolg!

flattr this!

Kommentare (3)

  1. #1 schorsch
    27. April 2020

    Über den ‘esoteric way’ bin ich auch gestolpert – er hat hier aber in seinem in der IT gebräuchlichen Bedeutung doch seine volle Berechtigung. In der IT ist eine esoterische Programmiersprache z. B. eine solche, die konzeptionell durchaus geeignet ist, konkrete Probleme zu lösen, für eine praktischen Umsetzung jedoch völlig ungeeignet sind.

    Ein Beispiel ist die Programmiersprache whitespace, deren Befehle und Anweisungen ausschließlich aus nicht druckbaren Zeichen (Tabs, Leerzeichen, Zeilenumbrüche) bestehen.

    Unter dieser Definition ist die Nutzung eines Befehls wie diff mit seinen grob fünf Dutzend Parametern und Anweisungen und Formatierungsmerkmalen, alle wild untereinander kombinierbar, am besten noch aus einem komplexen find heraus gepiped, ein hoch esoterischer way of solution.

    • #2 Christian Meesters
      28. April 2020

      Ha, SO kann man das natürlich sehen. Um Missverständnisse zu vermeiden, habe ich ein Artikelupdate eingefügt. Danke für den Hinweis.

  2. #3 Christian Berger
    28. April 2020

    Naja, exotische Software für Dinge zu verwenden für die die nie gedacht war ist in der “freien Wirtschaft” völlig normal. Reproduzierbarkeit hat da keinen Wert, denn Reproduzierbarkeit führt zu höherer Produktivität und somit geringerem Arbeitskrafteinsatz.