Endlich geht es in der der kleinen Serie (1. Teil, 2. Teil) zu schauen, was zu wirklich nachhaltiger Data Science und damit auch Bioinformatik gehört – und warum das so ist. Zunächst aber: Was haben wir vor Augen haben, wenn wir wissenschaftliche Nachhaltigkeit so richtig weit fassen? Wir können Ziele einer idealen Datenanalyse und alles…

Pipeline oder nicht Pipeline? Im ersten Teil ging es darum zu charakterisieren was eine Pipeline in der Bioinformatik ist. Hoffentlich wurde klar, dass die Weise wie manche Datenanlyse Pipeline umgesetzt wird, extrem verschwenderisch sein kann. Wer erst einmal soweit ist zu erkennen, dass eine gegebene Pipeline heterogene Ressourcenanforderungen hat und das dies ernsthafte Performanceprobleme birgt,…

Was eine Pipeline ist, weiß jeder … In der Bioinformatik ist mit einer Pipeline die Folge von Programmen gemeint, die eine bestimmte Analyse mit mehreren Schritten ermöglichen. Hierbei kann die Pipeline, ganz analog einer “echten” auch verzweigt sein. Sprich: Pipelines entsprechen in Ihrer Abfolge von aufgerufenen Programmen stets gerichteten azyklischen Graphen — in der Regel…

Mitten in den rheinlandpfälzischen Herbstferien startet wird in Mainz das Semester wieder beginnen – oder besser: die Vorlesungszeit wieder starten (in anderen Bundesländern sind die Termine andere). Es wird ein ungewöhnliches Semester werden. Eines, in dem die Studierenden mit ihren Träumen und Idealen sitzen werden – meist hinter einem Bildschirm. Kein Brainstorming während oder nach…

Lange schon finde ich die Reihe “Ten simple rules for …” des Journals “PLOS COMPUTATIONAL BIOLOGY” amüsant. Ich lese sie gerne und ab und an gibt es Anregung zum Nachdenken – keineswegs sollte man annehmen, dass mit zehn einfachen Regeln ein beliebiges Thema allumfassend behandelt werden kann. Und so ist es auch nicht sinnvoll sich…

UAP – die “Universal Analysis Pipeline” wurde bereits im letzten Jahr als “Pipeline”-Lösung für Bioinformatik-workflows publiziert[Kämpf et al., 2019]. Für diesen Artikel ist wichtig zu verstehen, dass genomorientierte Bioinformatik (wie auch nahezu alle komplexe Datenanalytik) nahezu jederzeit bedeutet eine Analyse in eine Vielzahl von Schritten (z. B. – Achtung starke Vereinfachung – Qualitätsbestimmung, Qualitätskontrolle, Mapping,…

Das Publikationswesen in der Informatik ist für mich immer noch seltsam: Konferenzbeiträge, die als reguläre Artikel gelten und keine Zeitschriften die gut indiziert zu durchsuchen sind, wie in den Lebenswissenschaften oder den anderen Naturwissenschaften. Das Denken von Konferenz zu Konferenz, eine Welt in ausschließlich Prototypen und nicht Produktionssoftware oder wissenschaftliche Ergebnisse, wie Naturwissenschaftler sie gewinnen,…

Besondere Zeiten sind dies. De facto findet die “International Supercomputing Conference” (ISC) in diesem Jahr ausschließlich online statt. Es ist DIE Konferenz im High Performace Computing (HPC)-Bereich in der unter anderem im halbjährlichen Wechsel mit ihrem amerikanischen Pendant die Liste der 500 schnellsten Supercomputer veröffentlicht wird. Eine Konferenz mit Messecharakter, vielen schaustellenden Firmen also. Aber…

Mit diesem Beitrag möchte ich meine kleine Serie vorläufig beenden. Lehre ist für manche an Hochschulen lästig, für mich aber gehört sie zur Wissenschaft dazu — ich finde sie spannend und so möchte ich auch in Zukunft immer wieder mal Aspekte der Hochschullehre allgemein und für HPC-Anwender im Speziellen zum Thema machen. Zur Sache Zugegeben:…

Im letzten Artikel habe ich beschrieben, dass die Ziele für unsere Kurse insbesondere unsere Ziele sind. Und auch die Inhalte sind unsere (zu einem nicht unwesentlichen Teil: meine) Inhalte. Das ist irgendwie unbefriedigend: Bliebe dies der status quo, muss das Rad ja immer wieder neu erfunden werden — und das in dem Wissen, dass es…