Wie sind wissenschaftliche Disziplinen vernetzt, und was ist der beste Indikator um diese Beziehungen zu berechnen? Traditionell stand dafür vor allem eine Gräße parat: Die Anzahl an Zitierungen, die eine wissenschaftliche Veröffentlichung durch spätere Paper erhielt. Jetzt aber haben Forscher_innen aus New Mexico in PLoS ONE eine neue Studie veröffentlicht, in der sie auf größere Datenmengen zurückgreifen, die aus Interaktionen von Benutzer auf den Onlineportalen von wissenschaftlichen Magazinen stammen.

2006 gab Elsevier bekannt, dass seit dem Start ihres Onlineportals in 1999 bereits 1 Milliarde Artikel heruntergeladen worden waren. Im Vergleich dazu gab Thomson Scientific die Gesamtzahl aller Zitierungen in Papern seit 1900 mit etwa 600 Millionen an. So verwundert es wenig, dass den Forscher_innen aus 12 Monaten in 2006/7 fast 1 Milliarde Benutzer-Interaktionen mit den Portalseiten verschiedener Verlage zur Verfügung standen.

Unter einer Interaktion versteht man aber alles, was der Benutzer auf einer Seite so anklickt. Daher wird alles herausgefiltert, was wirkliches Interesse an einer Publikation andeutet, wie der Klick auf “Read More” oder auf den Download-Button. Dann wurden diese Interaktionen den verschiedenen Fachbereichen zugeordnet, wobei man bereits bei der Wahl der Portale darauf geachtet hatte, alle wissenschaftlichen Kategorien abzudecken.
Aus der alten Methode, die Vernetzung anhand der Zitierungen abzuleiten, ist ein starkes Ungleichgewicht zu den Naturwissenschaften bekannt, die mehr als 90% der Zitate stellen. Die Frage war also: Bildet das Benutzerinteresse, das ja nicht nur von anderen Forschern aus einem verwandten Bereich stammt, eine andere Gewichtsverteilung auf die Diszplinen?

Um die Vernetzung der Magazine abzuleiten (die dann letztendlich auf Klassen von Disziplinen vereinfacht wird), setzt man auf eine Technik aus dem Datamining. Zur Verfügung steht ein sogenannter “Clickstream”, die Zeitserie an Aktionen die ein Benutzer auf dem Portal vornimmt. Ein Magazin A wird dann als verwandt zu B bezeichnet, wenn in einem Clickstream unmittelbar nach Klicks in A Klicks in B folgen. Aus der gesamten Menge an Klickfolgen gewinnt man so auch die Wahrscheinlichkeit, dass ein Klick von A nach B führt – und so baut man nicht nur ein Netz, sondern auch ein Wahrscheinlichkeits-Modell, das eine Simulation der Bewegung anleiten kann.

Indem man jetzt zufällige Bewegungen durch dieses Netzwerk simuliert, kann man die Stärke der Beziehungen zwischen verschiedenen wissenschaftlichen Magazinen festlegen. Die am stärksten verknüpften 50000 Journals wurden ausgewählt, um dieses Bild der Vernetzung der wissenschaftlichen Disziplinen zu erstellen (wie immer – Klick für ein größeres Bild):

i-f133af1ae6cd087ebd93fb7e29c3d3a5-journal.pone.0004803.g005-thumb-400x380.png

Reproduziert aus: Bollen et al. 2012, PLoS ONE

Selbstverständlich ist das erst eine frühe Arbeit aus dieser neuen Datenquelle, die noch einiges an Verfeinerungen erlaubt. Die Forscher_innen sehen noch mindestens Notwendigkeiten, besser herauszufinden wie die Seitennavigation Klickbewegungen manipuliert, wie verschiedene Arten Paper zu finden (Empfehlungen von Kollegen, verlinkte Artikel, Suchergebnisse) die Klicks motivieren, und in wie weit die Annahme einer einfachen Zufallsbewegung durch das Netz wirklich zutreffend ist für die doch stärker gelenkte Suche nach wissenschaftlicher Lektüre.
Abgesehen davon aber kommen sie bereits zum Ergebnis, und man kann es im Bild deutlich sehen, dass die Sozial- und Geisteswissenschaften deutlich besser repräsentiert sind. Das lässt den Schluss zu, dass die Methode auf Basis der Zitierungen nicht die geeignete ist, um die Vernetzung der Wissenschaften abzubilden.



Kommentare (5)

  1. #1 Andreas
    01/04/2012

    Mathematik kommt nicht vor, nur Statistik. Ist das so zu erwarten?

  2. #2 Jörg
    01/04/2012

    Ich würde vermuten, dass “harte” Mathematik irgendwo mitten im pinken Cluster oben rechts steckt.

  3. #3 SCHWAR_A
    01/05/2012

    Ich denke, daß man hier wohl besser clustern/zusammmenfassen müßte, um ein ordentliches Bild der Abhängigkeiten zu erkennen. Einfach jedes Paper mit seinen Querverweisen graphisch aufzumalen reicht nicht, um die wissenschaftliche Vernetzungsstruktur zu präsentieren. Daher stammt wohl auch der Eindruck, Geisteswissenschaften seien besser repräsentiert. Hier wird einfach viel publiziert, was nicht wirklich bewertet werden kann und dadurch evt. gar nicht erst erscheinen würde…

    Außerdem zweifle ich Teile der Struktur an:
    Beispiel Archäologie: Ich würde erwarten, daß es auch Links zu Physik und Chemie gibt – diese fehlen aber völlig… genau wie Psychologie zu PharmaChemie… etc.

    Das ist also wieder nur so eine Art Statisktik, die die Wirklichkeit nicht korrekt widergibt… Schade eigentlich.

    Herzliche Grüße.

  4. #4 monkey7000
    01/08/2012

    Es geht hier nicht darum, wie eng gewisse Wissenschaften miteinander Verbunden sind, sondern es werden die Zitierungen beobachtet

    d.h. Archäologie hat keine Verbindungen zur Chemie oder Physik, da z.B. sicher nicht jemand zitiert wird wenn man die C14 Methode anwendet.

  5. #5 Daniel
    01/30/2012

    Jörg,

    auch sie werden nach ihrem jugedlichen Hochmut noch lernen, dass sich Qualität
    und Wissen schlussendlich nicht über die von ihnen gezeigten Möglichkeiten offenbart.
    Sie kommen mir ein bisschen so vor wie S. Rahmstorf, welchem in einer Kontroverse mit H.v. Storch nichts weiter einfiel, als seine Anzahl an Publikationen in Nature mit denen des netten Hans zu vergleichen. Das ist einfach zu kindisch und so ähnlich benehmen sie sich leider auch.