Mit derartigen Befragungen kann selbstverständlich nur die Wirkung bzw. das Empfinden der Teilnehmenden erfasst werden, nicht den Fähigkeitenzuwachs. Hierzu kann ich objektiv nur anmerken: Ja, das Ziel der extrem naiven Anfängerfragen auf ein erträgliches Maß zu senken ist erreicht! Das ist tatsächlich nicht gering zu schätzen. Diese Fragen gibt es immer noch — vornehmlich durch Leute, die (noch) keine unserer Einführungskurse besucht haben oder wenn TeilnehmerInnen unmittelbar nach dem Kurs das Cluster nicht nutzen und dann, Monate später, wieder ihr Wissen zusammen kramen.

Und darüber hinaus? Wir führen keine Tests, Klausuren oder dergleichen durch. Die Teilnahme ist schließlich freiwillig, wir können (und wollen) uns nicht in jedem Fachbereich in die Prüfungsordnung schreiben lassen. Außerdem: Kann man mit einem Testat nach einem zweitägigem Crash-Kurs etwas Anderes erfassen als Kurzzeitgedächtnis und die Fähigkeit sich auf Testate einzustellen? Schließlich können TeilnehmerInnen nicht vorher büffeln und üben.

Auch eine Erfassung der Codequalität der Jobscripte unserer Nutzer können wir nicht systematisch durchführen. Ich versuche mal ehrlich zu sein: Gerade in der Datenanalytik/Bioinformatik sehe ich den Einfluss der Kurse auf die selbst erarbeiteten Arbeitsflüsse als sehr gering an. Das ist erkennbar an der Art der Fragen, der Art der Skripte (immer eines pro Arbeitsschritt) und der Frustration der Anwender.

Insgesamt bleibt die Erfassung von Kursqualitäten ein generelles Problem. Ich hoffe mit Kollegen diesen Aspekt in den nächsten Jahren zu verbessern. Mehr dazu im nächsten Artikel.

Die (Ab-)Gründe

Man muss sich klar machen, dass die HPC-Nutzung auch (zumindest z. Zt. und bei uns) Programmierung/Skripte schreiben und das eigenständige Parameterisieren von Jobs beinhaltet. Und DAS bedeutet die Notwendigkeit völlig neue Konzepte zu vermitteln, denn die meisten Teilnehmenden sind WissenschaftlerInnen ohne IT-Hintergrund. Hinzukommt für viele die Notwendigkeit ganze Arbeitsflüsse per Skript zu beschreiben — und das auf einer Maschine, die eben nicht einem x-beliebigen Server gleichkommt. Das überfordert viele.

Warum das so ist wird klar, wenn man sich mit der Psychologie des Lernens ein wenig befasst. Wie ich bereits beschrieb, muss ich mich auf einen heterogenen Hintergrund von Nutzern einstellen und davon ausgehen, dass diese kaum Kenntnisse des wissenschaftlichen Rechnens und Programmierens mitbringen. Oder anders ausgedrückt: Meine Situation als Lehrer ist analog zu Informatikern, die den Einstieg in die Programmierung unterrichten. Mangels Studien im eigenen Bereich, kann ich meine Situation immerhin mit dieser vergleichen und sehen, dass man lange und wiederholt zu der Erkenntnis gekommen ist, dass Befunde übertragbar sind. Dankenswerterweise ist die Vermittlung von Grundlagenwissen in der Programmierung schon länger Forschungsgegenstand (weil viele DozentInnen bemerkt haben, dass prinzipiell einfachste Dinge nicht im ersten Anlauf vermittelbar sind)[Soloway and Bonar, 1983; McCracken et al., 2001; Lister et al., 2004]. Und wir/ich haben/habe nur diesen einen Anlauf den TeilnehmerInnen mehrere neue Konzepte zu vermitteln. Also verbleiben unweigerlich ein großer Teil der KursteilnehmerInnen auf einem Niveau, dass ein selbsttätiges Verfassen mehrschrittiger Analyseverfahren in Form von Jobscripten nicht erlaubt. Dieses Ziel ist also — unter dem gegebenen Rahmen — nicht zu erreichen. Sollte jemand den heiligen Gral gefunden haben und mit Belegen (!) widersprechen können, räume ich einen Gastartikel ein!

Lösungswege?

Also den Kopf in den Sand stecken?  Die stete Verbesserung des Kurses, die Einbettung in weitere Kurse (z. B. Programmierung), das Herausgehen in die Fachbereiche und dort für unsere Services zu werben (z. B. Versionsverwaltung, Mit-Betreuung studentischer Arbeiten – gerade in AGs ohne IT-Bezug, etc.) sind selbstverständlich.

Vor allem — kenntnisreichen Mitlesenden ist es bestimmt aufgefallen — habe ich noch gar nicht über Workflowmanager geschrieben. Ich bin überzeugt: Wenn es nicht möglich ist einer breiten Masse zu vermitteln, wie sie beliebige, reproduzierbare Datenverarbeitung auf einem HPC-System gestalten kann, dann gilt es das System weitmöglichst zu abstrahieren, um die Nutzung des Systems attraktiv zu gestalten. HPC-Systeme sind einfach umständlich: Batchsysteme, besondere Filesysteme und nicht zuletzt der Nimbus des unnötig Komplexen, schrecken manche Nutzergruppen ab.

flattr this!

1 / 2 / 3