In der heutigen Wissenschaftswelt ist es äußerst wichtig Artikel über seine wissenschaftliche Arbeit zu veröffentlichen. Diese alleinige Konzentration auf den paper-output und das Ignorieren anderer Tätigkeiten (Lehre, Öffentlichkeitsarbeit) habe ich hier zwar schon öfter kritisiert – aber die Dinge sind nunmal wie sie sind. Wenn man ein Paper geschrieben hat, ist es enorm wichtig, dass man auch zitiert wird. Die Anzahl der Zitate wird oft als alleinige Kennzahl für den Erfolg (oder Mißerfolg) einer wissenschaftlichen Karriere herangezogen (was ebenfalls nicht unproblematisch ist).
Es ist daher durchaus angebracht, sich darüber Gedanken zu machen wie man seine Artikel so optimiert, dass sie auch von anderen gefunden, gelesen und zitiert werden. Christian hat gestern darüber einen interessanten Artikel geschrieben und heute ist am Preprint-Server arxiv eine Arbeit erschienen die sich mit einem speziellen Aspekt dieser Thematik beschäftigt: Wie beeinflusst der Name des Autors die Zitierhäufigkeit?
In ihrer Arbeit mit dem Titel “Orthographic Correlations in Astrophysics” haben die Autoren untersucht, ob der Anfangsbuchstabe des Nachnamens einen positiven oder negativen Einfluss auf die Häufigkeit hat, mit der ein Paper zitiert wird. Diese Forschung war sicherlich nicht ganz uneigennützig – heissen die Wissenschaftler doch Joe Zuntz, Thomas Zlosnik, Caroline Zunckel und Jonathan Zwart.
Speziell haben sie die Gruppe der AWNNTEOTAs untersucht – das sind die “Authors with names near the end of the alphabet”. Es werden zwei Hypothesen überprüft:
- H0: AWNNTEOTAs werden wegen einer intrinsischen Überlegenheit (“superiority”; dieses Wort ist hier jedoch rein als numerische Beschreibung der Zitate zu verstehen) öfter zitiert.
- H1: AWNNTEOTAs werden weniger oft zitiert weil sie diskriminiert werden.
Die dritte mögliche Hypothese – zwischen Nachnamen und Zitierhäufigkeit besteht kein signifikanter Zusammenhang – wurde wegen ignoriert da sie ja ganz offensichtlich implausibel ist.
Um die Hypothesen zu testen haben sich Zuntz, Zlosnik, Zunckel und Zwart Publikationen aus der ADS (Astrophysics Data System) Datenbank angesehen. Für 12 zufällig ausgewählte Monate haben sie gemessen, wie die Häufigkeit der Zitate von den Anfangsbuchstaben der Nachnamen der Autoren aussehen. Natürlich wurde hier alles korrekt und mit vernünftigen statistischen Methoden analysiert. Die Autoren schreiben:
To efficiently and understandably analyze our data we adopt the usual astrophysical paradigm: Bayesio-frequentist statistics, where frequentist methods are used and the results interpreted as though they were Bayesian probabilities. We also follow usual practice and use a number of different estimators, continuing until we find one that can demonstrate the correct hypothesis to be true.
Gut – das scheint ja alles seine Ordnung zu haben! Eine erste Analyse der mittleren Zitationsrate schien zunächst zu zeigen, dass Hyothese H1 zutrifft. Das nächste Bild zeigt so eine Statistik für den Monat Januar 2005; dem einzigen Monat, bei dem sich ein umgekehrter Trend (H0) zeigte:
Auf der x-Achse findet man die Anzahl der Zitate (die Achse wurde skaliert um die Anschaulichkeit zu erhöhen). Die y-Achse zeigt den Buchstaben und die Farbe gibt die Wurzel aus der Anzahl der Paper für den jeweiligen Buchstaben wieder. Man sieht, dass “S” in diesem Monat äußerst schlecht publiziert hat; “A” und “B” dafür sehr gut. In einem nächsten Schritt wurden von allen Papers nur die obersten 5% mit der höchsten Anzahl an Zitaten verwendet. Das ist völlig legitim – denn solange ein Autor ein paar extrem gut zitierte Artikel hat sind die unzitierten völlig irrelevant. Das nächste Bild zeigt das Ergebnis:
Die Fehler der Datenpunkte wurde mit einem Algorithmus berechnet der aus kosmologischer Supernova-Forschung stammt und an den Werten wurde solange rumgeschreibt bis die Korrelation gut genug war. Leider zeigt das Bild, dass Hypothese H1 zu stimmen scheint. Deswegen wurden die Daten nochmal analysiert; diesmal aber mit einem “normalisierten h-Index”. Hier sieht man nun endlich das korrekte Ergebnis:
Hypothese H0 ist also richtig: Autoren mit ersten Buchstaben des Nachnamens die weit hinten im Alphabet liegen schreiben also tatsächlich Arbeiten die öfter zitiert werden! Die Autoren merken an, dass hier natürlich noch mehr Forschung nötig ist – das man ihre Schlußfolgerungen aber auch direkt stärken könnte; was sie dann auch gleich tun:
Eine interessante Arbeit. Kollegen wie Ali Arbia, Ulrich Berger, Ludmila Carone und wohl leider auch ich haben es also blöd getroffen. Jörg Rings ist da schon ein wenig besser dran… Und ich werd mich jetzt mal erkundigen, wie das mit einer Namensänderung funktioniert. Irgendwelche Vorschläge für gute Nachnamen, die mit “Zy” anfangen?
P.S. Heute ist der erste April. Ich würde zwar nieeee auf die Idee kommen, die Leute mit irgendwelchen gefakten Mitteilungen reinzulegen – aber man kann nie wissen. Forschungsergebnisse wie das eben beschriebene sollte man daher mit etwas Vorsicht behandeln 😉
Kommentare (28)