In der heutigen Wissenschaftswelt ist es äußerst wichtig Artikel über seine wissenschaftliche Arbeit zu veröffentlichen. Diese alleinige Konzentration auf den paper-output und das Ignorieren anderer Tätigkeiten (Lehre, Öffentlichkeitsarbeit) habe ich hier zwar schon öfter kritisiert – aber die Dinge sind nunmal wie sie sind. Wenn man ein Paper geschrieben hat, ist es enorm wichtig, dass man auch zitiert wird. Die Anzahl der Zitate wird oft als alleinige Kennzahl für den Erfolg (oder Mißerfolg) einer wissenschaftlichen Karriere herangezogen (was ebenfalls nicht unproblematisch ist).

Es ist daher durchaus angebracht, sich darüber Gedanken zu machen wie man seine Artikel so optimiert, dass sie auch von anderen gefunden, gelesen und zitiert werden. Christian hat gestern darüber einen interessanten Artikel geschrieben und heute ist am Preprint-Server arxiv eine Arbeit erschienen die sich mit einem speziellen Aspekt dieser Thematik beschäftigt: Wie beeinflusst der Name des Autors die Zitierhäufigkeit?


In ihrer Arbeit mit dem Titel “Orthographic Correlations in Astrophysics” haben die Autoren untersucht, ob der Anfangsbuchstabe des Nachnamens einen positiven oder negativen Einfluss auf die Häufigkeit hat, mit der ein Paper zitiert wird. Diese Forschung war sicherlich nicht ganz uneigennützig – heissen die Wissenschaftler doch Joe Zuntz, Thomas Zlosnik, Caroline Zunckel und Jonathan Zwart.

Speziell haben sie die Gruppe der AWNNTEOTAs untersucht – das sind die “Authors with names near the end of the alphabet”. Es werden zwei Hypothesen überprüft:

  • H0: AWNNTEOTAs werden wegen einer intrinsischen Überlegenheit (“superiority”; dieses Wort ist hier jedoch rein als numerische Beschreibung der Zitate zu verstehen) öfter zitiert.
  • H1: AWNNTEOTAs werden weniger oft zitiert weil sie diskriminiert werden.

Die dritte mögliche Hypothese – zwischen Nachnamen und Zitierhäufigkeit besteht kein signifikanter Zusammenhang – wurde wegen ignoriert da sie ja ganz offensichtlich implausibel ist.

Um die Hypothesen zu testen haben sich Zuntz, Zlosnik, Zunckel und Zwart Publikationen aus der ADS (Astrophysics Data System) Datenbank angesehen. Für 12 zufällig ausgewählte Monate haben sie gemessen, wie die Häufigkeit der Zitate von den Anfangsbuchstaben der Nachnamen der Autoren aussehen. Natürlich wurde hier alles korrekt und mit vernünftigen statistischen Methoden analysiert. Die Autoren schreiben:

To efficiently and understandably analyze our data we adopt the usual astrophysical paradigm: Bayesio-frequentist statistics, where frequentist methods are used and the results interpreted as though they were Bayesian probabilities. We also follow usual practice and use a number of different estimators, continuing until we find one that can demonstrate the correct hypothesis to be true.

Gut – das scheint ja alles seine Ordnung zu haben! Eine erste Analyse der mittleren Zitationsrate schien zunächst zu zeigen, dass Hyothese H1 zutrifft. Das nächste Bild zeigt so eine Statistik für den Monat Januar 2005; dem einzigen Monat, bei dem sich ein umgekehrter Trend (H0) zeigte:

i-cc255a2ea1fd730354db988bec8a038a-orto1-thumb-500x397.jpg

Auf der x-Achse findet man die Anzahl der Zitate (die Achse wurde skaliert um die Anschaulichkeit zu erhöhen). Die y-Achse zeigt den Buchstaben und die Farbe gibt die Wurzel aus der Anzahl der Paper für den jeweiligen Buchstaben wieder. Man sieht, dass “S” in diesem Monat äußerst schlecht publiziert hat; “A” und “B” dafür sehr gut. In einem nächsten Schritt wurden von allen Papers nur die obersten 5% mit der höchsten Anzahl an Zitaten verwendet. Das ist völlig legitim – denn solange ein Autor ein paar extrem gut zitierte Artikel hat sind die unzitierten völlig irrelevant. Das nächste Bild zeigt das Ergebnis:

i-294d894fb2de9d476495dc93f2c2cc03-orto2.jpg

Die Fehler der Datenpunkte wurde mit einem Algorithmus berechnet der aus kosmologischer Supernova-Forschung stammt und an den Werten wurde solange rumgeschreibt bis die Korrelation gut genug war. Leider zeigt das Bild, dass Hypothese H1 zu stimmen scheint. Deswegen wurden die Daten nochmal analysiert; diesmal aber mit einem “normalisierten h-Index”. Hier sieht man nun endlich das korrekte Ergebnis:

i-d55f6495f5f52f0637cbb206a612c4af-orto3.jpg

Hypothese H0 ist also richtig: Autoren mit ersten Buchstaben des Nachnamens die weit hinten im Alphabet liegen schreiben also tatsächlich Arbeiten die öfter zitiert werden! Die Autoren merken an, dass hier natürlich noch mehr Forschung nötig ist – das man ihre Schlußfolgerungen aber auch direkt stärken könnte; was sie dann auch gleich tun:

i-3441c6df2c8922653f7f9a70794c6c31-orto4-thumb-500x293.jpg

Eine interessante Arbeit. Kollegen wie Ali Arbia, Ulrich Berger, Ludmila Carone und wohl leider auch ich haben es also blöd getroffen. Jörg Rings ist da schon ein wenig besser dran… Und ich werd mich jetzt mal erkundigen, wie das mit einer Namensänderung funktioniert. Irgendwelche Vorschläge für gute Nachnamen, die mit “Zy” anfangen?

P.S. Heute ist der erste April. Ich würde zwar nieeee auf die Idee kommen, die Leute mit irgendwelchen gefakten Mitteilungen reinzulegen – aber man kann nie wissen. Forschungsergebnisse wie das eben beschriebene sollte man daher mit etwas Vorsicht behandeln 😉

Kommentare (28)

  1. #1 Ludmila
    1. April 2010

    Heyyyy und ich dachte immer, ich hab es gut getroffen, weil ich mit meinem Namen aich bei einer langen Autorenliste immer recht weit oben stehe.

  2. #2 Bullet
    1. April 2010

    Ich würde zwar nieeee …

    nc

  3. #3 Thilo Kuessner
    1. April 2010

    Ich frage mich, wie repräsentativ die Vergleichsgruppen gewählt wurden (falls der Artikel ernstgemeint ist).

    Namen, die mit X, Y oder Z anfangen, sind im Chinesischen oder Russischen (außer X) sicher häufiger als im Deutschen oder Französischen. In China oder Rußland gibt es viel mehr Fachzeitschriften, auch Diplomarbeiten etc. werden veröffentlicht, dementsprechend gibt es natürlich auch mehr Zitate.

    Gilt dieselbe Korrelation denn auch noch, wenn man innerhalb einzelner Universitäten Anfangsbuchstabe und Zitierhäufigkeit vergleicht?

  4. #4 Florian Freistetter
    1. April 2010

    @Thilo: Lies den Artikel doch einfach nochmal genau, dann sollten deine Fragen beantwortet werden 😉

  5. #5 David
    1. April 2010

    Zuntz, Zlosnik, Zunckel und Zwart…

    Aprilscherz? nö, kann nicht sein

  6. #6 Thilo
    1. April 2010

    @ David: die Leute gibt es wirklich. Und nicht jeder Artikel, in dem mathematischer Unsinn steht oder kreativ mit Statistik umgegangen wird, ist ein Scherzartikel…
    Abgesehen davon könnten auch in einem Scherzartikel korrekte Statistiken verwendet worden sein. Z.B. findet man in mathscinet 140852 Artikel zum Anfangsbuchstaben W, aber nur 62210 mit Anfangsbuchstaben E.

  7. #7 Florian Freistetter
    1. April 2010

    @Thilo: Aber lies dir doch mal durch was die schreiben bzw. was ich geschrieben habe. Da wird doch sofort klar, dass der Artikel selbst und die Statistik völliger Unsinn sind. Ich hab ja sogar extra den Teil wortwörtlich zitiert in dem die “Methode” beschrieben wird. Spätestens wenn sie die “Hypothesen” aufstellen muss man doch sofort merken, was los ist…

  8. #8 Bullet
    1. April 2010

    Zusatz:

    Die dritte mögliche Hypothese – zwischen Nachnamen und Zitierhäufigkeit besteht kein signifikanter Zusammenhang – wurde wegen ignoriert da sie ja ganz offensichtlich implausibel ist.

    Wenn DAS kein Texas Sharpshooter ist … *g*.

  9. #9 Bullet
    1. April 2010

    ach Kagge … nicht Scharfschütze.
    Wie heißt das, wenn ich nur Daten zulasse, die in der Nähe meiner Wunschvorstellung liegen?

  10. #10 Ulrich Berger
    1. April 2010

    @ Florian:
    Jetzt mal abgeshen vom Datum: ich weiß ja nicht, wie das in der Astronomie ist, aber bei uns ist das ein ganz reales Problem: http://www.jstor.org/stable/30033639

  11. #11 nihil jie
    1. April 2010

    naja… klingt interessant aber ich weiss nicht was ich darüber denken soll… könnte man wirklich pauschal sagen dass es so ist ? oder passiert das nur in bestimmten kreisen ?
    also ich habe mal was erlebt was auf diese problematik passen könnte. ich habe mal mein zivildienst im altenheim gearbeitet und dann auch noch einige monate in einem krankenhaus. irgend wann mal sprach mich mal ein doc auf meinen namen hin. muss da zu sagen dass jemand aus meiner familie vor gut 200 jahren einen ganzen medizinzweig begründet hat. und das wusste der doc weil er genau diesen fachlich belegte. naja… nach dem sich das herumgesprochen hat änderte sich auch der umgang mit mir und auch die erwartungen an mich stiegen. was ich echt zum kotzen fand, weil ich kein bock hatte diesen erwartungen, die offensichtlich an meinem familiennamen festgemacht wurden, gerecht zu werden.
    wie auch immer… in dem fall hatte ein name schon eine sichtbare wirkung. zum glück hatte ich nie vor gehabt medizin zu studieren… 😉

  12. #12 Thilo Kuessner
    1. April 2010

    Da wird doch sofort klar, dass der Artikel selbst und die Statistik völliger Unsinn sind. Ich hab ja sogar extra den Teil wortwörtlich zitiert in dem die “Methode” beschrieben wird.

    Ja gut, aber das unterscheidet sich doch jetzt nicht so wesentlich von anderen Arbeiten zu ähnlichen Themen. Wie soll man denn da noch auseinanderhalten, was ernstgemeint ist und was nicht?

  13. #13 Bullet
    1. April 2010

    hehe .. Thilo isn Neeeeeeerd! :)

    (jetz krieg ich Haue *flitz*)

  14. #14 Thilo Kuessner
    1. April 2010

    Selber

  15. #15 Ulrich Berger
    1. April 2010

    @ nihil jie:

    irgend wann mal sprach mich mal ein doc auf meinen namen hin. muss da zu sagen dass jemand aus meiner familie vor gut 200 jahren einen ganzen medizinzweig begründet hat.

    Oh mein Gott! Heißen Sie mit Nachnamen etwa Hahnemann?!?

  16. #16 Bullet
    1. April 2010

    @Thilo: gar nich.

  17. #17 Günter
    1. April 2010

    Schöner Scherz!
    Ich denke sogar, er hat durchaus einen gewissen Realitätsbezug.
    Statistisch gesehen würde ich allerdings eher vermuten, dass Arbeiten von Wissenschaftlern mit Namen vorn im Alphabet bevorzugt erwähnt werden. Ich könnte mir vorstellen, dass beim Abschreiben von Bibliographien viele nicht bis zum Ende durchhalten 😉

  18. #18 nihil jie
    1. April 2010

    @Ulrich Berger

    die auflösung und erklärung habe ich per mail gepostet… muss ja hier nicht jeder wissen 😉

  19. #19 Florian Freistetter
    1. April 2010

    @Ulrich: Klar, solche Untersuchungen kann man auch seriös machen. Eine besonders nette zeigt, dass man öfter zitiert wird, je weiter oben man mit seiner Arbeit im arxiv-Newsletter vorkommt… Aber die Autoren dieser Arbeit blödeln ja von Anfang an demonstrativ rum – da ist es nicht schwer rauszufinden das es nur Unsinn ist 😉

  20. #20 Vizioon
    1. April 2010

    Wie wäre es mit Künstlernamen? Z.B. Florian “Zyz” Freistetter?
    Mal im Ernst, da müßte man doch Namensverteilung, Fachgebiet und Veröffentlichungshäufigkeit mit einbeziehen.

  21. #21 Serge
    1. April 2010
  22. #22 codeX
    2. April 2010

    “Wie heißt das, wenn ich nur Daten zulasse, die in der Nähe meiner Wunschvorstellung liegen?”
    Würde mich auch interessieren.

  23. #23 Jürgen Schönstein
    2. April 2010

    @codeX @Bullet

    “Wie heißt das, wenn ich nur Daten zulasse, die in der Nähe meiner Wunschvorstellung liegen?”
    Würde mich auch interessieren.

    Cherrypicking!

  24. #24 H.M.Voynich
    2. April 2010

    Alles Käse.
    Es ist doch offensichtlich, daß alle wichtigen Astronomen mit H beginnen.

  25. #25 Florian Freistetter
    2. April 2010

    @Voynich: “Es ist doch offensichtlich, daß alle wichtigen Astronomen mit H beginnen.”

    Herr Freistetter?? (Das ist aber schon etwas diskriminierend gegenüber den Frauen)

  26. #26 rolak
    2. April 2010

    ..aber nicht doch, er meinte ‘H.M.Voynich‘ – zur Sicherheit von beiden Seiten präpariert.
    Eigentlich steht oben allerdings nicht ‘..die Namen aller wichtigen Astronomen mit H beginnen’, so daß die Frage für die gemachte Aussage erst noch gefunden werden müßte. Wie wäre es denn z.B. mit “Wie sortieren Astronomen Tiernamen?”? Zusatzfrage: Womit beginnen denn die unwichtigen Astronomen?

  27. #27 Redfox
    5. April 2010

    Diesen Aprilscherz ihn oder her, es scheint tatsächlich Forschung auf diesem Gebiet zu geben:

    Wie der Name die Karriere steuert

    Sandra Maischberger stammt aus München und arbeitet als Moderatorin – das kann kein Zufall sein, behaupten Psychologen. Namen beeinflussen Leistung und Berufswahl, glauben sie.

    Unbewusstes Arbeits-ABC

    Buchstaben Wenn Arbeitgeber und Arbeitnehmer zusammenfinden, spielen möglicherweise auch ihre Initialen eine Rolle. Am Beispiel von 582.000 Berufstätigen haben belgische Psychologen ermittelt, dass die Nachnamen und die Firmennamen deutlich häufiger mit dem gleichen Buchstaben beginnen als bei zufälliger Verteilung zu erwarten.

    http://en.wikipedia.org/wiki/Name_letter_effect

    Ich entsinne mich auch, das mal die Frage untersucht wurde in wie weit sich der erste Buchstabe des Nachnamens eines Politikers auf seine Karrierechancen auswirkt. Das Ergebnis war das Politiker mit einem Anfangsbuchstaben am Anfang des Alphabets bessere Karrieren hatten als die am Ende des Alphabets. Die Forscher vermuteten das Politiker die auf Namenslisten an vorderster Stelle stehen bei der Postenvergabe eher berücksichtigt werden.
    Das Paper dazu finde ich jetzt leider nicht mehr.

  28. #28 Redfox
    5. April 2010

    Diesen Aprilscherz ihn oder her, es scheint tatsächlich Forschung auf diesem Gebiet zu geben:

    Wie der Name die Karriere steuert
    Sandra Maischberger stammt aus München und arbeitet als Moderatorin – das kann kein Zufall sein, behaupten Psychologen. Namen beeinflussen Leistung und Berufswahl, glauben sie.

    Unbewusstes Arbeits-ABC
    Buchstaben Wenn Arbeitgeber und Arbeitnehmer zusammenfinden, spielen möglicherweise auch ihre Initialen eine Rolle. Am Beispiel von 582.000 Berufstätigen haben belgische Psychologen ermittelt, dass die Nachnamen und die Firmennamen deutlich häufiger mit dem gleichen Buchstaben beginnen als bei zufälliger Verteilung zu erwarten.

    http://en.wikipedia.org/wiki/Name_letter_effect

    Ich entsinne mich auch, das mal die Frage untersucht wurde in wie weit sich der erste Buchstabe des Nachnamens eines Politikers auf seine Karrierechancen auswirkt. Das Ergebnis war das Politiker mit einem Anfangsbuchstaben am Anfang des Alphabets bessere Karrieren hatten als die am Ende des Alphabets. Die Forscher vermuteten das Politiker die auf Namenslisten an vorderster Stelle stehen bei der Postenvergabe eher berücksichtigt werden.
    Das Paper dazu finde ich jetzt leider nicht mehr.