Der bekannte Harvard Professor Marc Hauser wurde des wissenschaftlichen Fehlverhaltens überführt. Ich wollte die Geschichte aufrollen und darüber schreiben habe aber beim Googeln fesstellen müssen, dass das meiste von meinem Mit-Scienceblogling Nils abgedeckt wurde. Darum beschränke ich mich hier auf ein konkretes Beispiel dieses Fehlverhaltens.
Der Chronical of Higher Education zitiert ein internes Harvard Dokument in dem Vorwürfe betreffend eines konkreten Experimentes von Hauser diskutiert werden. Es illustriert wunderbar was ein solches Fehlverhalten sein kann, wie Selbstkontrolle in der Wissenschaft (nicht) funktioniert und was die Grauzonen sind.
Hauser machte in einem der fraglichen Experimente Verhaltensstudien mit Lisztaffen. Hauser und sein Team wollten untersuchen ob die Affen fähig sind, Veränderungen in Klangmustern festzustellen. Diese wäre ein Hinweis auf die Fähigkeit sich Sprache anzueignen. Der Experimentenaufbau war wie folgt: Jemand spielt eine Tonabfolge. Diese wird nach einer Weile verändert. Nun wird beobachtet ob der Affe auf diese Veränderung reagiert. Natürlich kann man den Affen nicht fragen. Ähnlich wie mit solchen Experimenten mit Babies versucht man eine Reaktion des untersuchten Objektes zu beobachten. Bei den Affen wäre die erwartete Reaktion, dass sie ihren Kopf in Richtung des Experimentators drehen.
Das Experiment wurde auf Video aufgezeichnet und danach unabhängig von einander die Reaktion der Lisztaffen ‘codiert’. Hauser und ein Forschungsassistent analysierten so die Reaktionen der Affen. Danach bat Hauser einen anderen Forschungsassistenten die Resultate durchzugehen und Schlussfolgerungen zu ziehen. Hauser stellte fest, dass die Affen reagierten und zwar statistisch signifikant. Die vom ersten Forschungsassistenten aufgezeichneten Reaktionen hingegen zeigten dies nicht. Im Gegenteil: Es schien als ob die Affen eher reagierten, wenn sich die Tonfolge nicht änderte. Dies wäre ein negatives Resultat. Es würde bedeuten, dass Lisztaffen die Fähigkeit Veränderungen in Tonmustern zu erkennen nicht haben. Leider verkaufen sich solche Resultate schlecht.
Der zweite Forschungsassistent störte sich am Widerspruch des unterschiedlichen Codings. Dieses ist noch kein eigentliches Warnsignal für ein Fehlverhalten. Gerade weil solche Widersprüche oft vorkommen (Menschen sind halt schlechte Messgeräte) hat man mindestens zwei Personen die sich unabhängig von einander sich dem Coding annehmen. Der Forschungsassistent schrieb also an Hauser eine e-mail und schlug vor, das Coding von einer dritten Personen erneut machen zu lassen. Hier wird die Geschichte nun seltsam.
Hauser reagierte nach einem Hin und Her zunehmend gereizt (“I am getting a little bit pissed here”) und schrieb, dass er keine Widersprüche sehen würde. Ohne Hausers Erlaubnis haben dann zwei seiner Forschungsassistenten die Analyse wiederholt. Immer noch gemäss dem internen Harvard Dokument, stellten sie fest, dass Hausers Coding schlicht falsch war und bestenfalls Wunschdenken entsprang. Er benutzte falsche Daten und war nicht bereit diese für eine Publikation zu hinterfragen. Offensichtlich war diese Experiment kein Einzelfall.
Dieser Vorfall illustriert einige Aspekte solcher Experimente gut. Erstens sieht man wie leicht man bei der Planung oder Ausführung eines solchen Experimentes betrügen kann. Viel basiert auf Vertrauen und das einzige was getan werden kann, ist so transparent wie irgendwie möglich zu arbeiten. Zweitens sieht man gut wie die Selbstkontrolle funktioniert (natürlich nur in der Annahme, dass der beschriebene Prozess wirklich so stattfand). Der Experimentenaufbau hatte eine eingebaute Kontrolle. Einige der beteiligten Forscher hinterfragten die eigenen Resultate und die der anderen. Widersprüche wurden nicht einfach stehen gelassen. Sie taten dies, obwohl sie riskierten, dass das Experiment als Misslungen betrachtet werden musste und sie daraus persönliche Nachteile haben würden (Zeitverlust, eventuell keine Publikation). Drittens sieht man, dass es immer eine gewisse Grauzone gibt. Menschen sind fehlbar, sehen verschiedene Dinge und Resultate sind oft nicht 1 oder 0. Die Grenze von gutwilliger Interpretation zu Wunschdenken zu willentlichem Betrug sind oft fliessend.
Auch die Rolle der universitären Hierarchie sieht man schön. Es ist oft üblich (zumindest so kenne ich es), dass dem Coding des Professors mehr Gewicht gegeben wird, manchmal wird gar empfohlen, dass Forschungsassistenten gar kein Coding machen sollten. Hauser war an den entscheidenden Hebeln für das Einreichen der Publikation und nutzte seine Position in dieser Hierarchie aus. Gleichzeitig muss man auch sagen, dass unter anderem wegen der Forschungsassistenten, das Fehlverhalten aufgedeckt wurde.
Mit seinem Fehlverhalten hat Hauser nun ein schlechtes Licht auf seine ganze Arbeit geworfen. Da das unsaubere Arbeiten offensichtlich keine einmalige Angelegenheit war, sondern über Jahre und systematisch praktiziert wurde, kann man nicht einfach von einem einmaligen Fehltritt sprechen. In einem meiner Forschungsprojekte stütze ich mich auf Artikel von Hauser (glücklicherweise nicht die zurückgezogenen). Nun stehe ich vor dem Dilemma ob ich diese Referenzen drin lassen soll oder nicht. Sein Fehlverhalten hat Auswirkungen die weit über Harvard und Hausers Arbeit hinaus gehen.
Die zurückgezogene Artikel sind:
“Rule learning by cotton-top tamarins,”Cognition 86, B15-B22 (2002)
“Rhesus monkeys correctly read the goal-relevant gestures of a human agent,” Proceedings of the Royal Society B 274, 1913-1918 (2007)
“The perception of rational, goal-directed action in nonhuman primates,” Science 317, 1402-1405 (2007)
Kommentare (12)