Wie gelangen wissenschaftliche Publikationen auf die vorderen Plätze bei akademischen Suchmaschinen – und wie können Autoren dieses Ranking aktiv beeinflussen? Solche Fragen sind Gegenstand der “Academic Search Engine Optimization”, die in einem aktuellen Paper vorgestellt wird.
Was ist Academic Search Engine Optimization?
Als Wissenschaftler hat man verständlicherweise ein gesundes Eigeninteresse daran, dass die eigenen Publikationen von möglichst vielen Kollegen gelesen werden – denn je sichtbarer die eigene Arbeit ist, umso größer ist die Chance auf Referenzen, interessante Kontakte und nicht zuletzt auch akademisches Prestige. Von zunehmender Bedeutung für die wissenschaftliche Recherche sind dabei spezielle Suchmaschinen wie Google Scholar, PubMed, SciPlore oder Cite Seer – die Frage, wie man dort für die “eigenen” Fachbegriffe am besten gefunden wird, liegt daher recht nahe. Und tatsächlich kann man einiges tun, um die Indizierung und Plazierung eigener Artikel auf Google Scholar – ähnlich wie das Ranking von Webseiten in den Indizes der großen Suchmaschinen – aktiv zu beeinflussen.
Mit den Mechanismen, welche die Sichtbarkeit akademischer Artikel im Internet bestimmen, befasst sich – analog zur Search Engine Optimization (SEO) – die Academic Search Engine Optimization (ASEO), die Jöran Beel und Bela Gipp von der Otto von Guerike-Universität in Magdeburg gemeinsam mit Erik Wilde von der UC Berkeley in einem im Januar im Journal of Academic Publishing erschienenen Paper wie folgt definieren:
“Academic Search Engine Optimization (ASEO) is the creation, publication and modification of scholarly literature in a way that makes it easier for academic search engines to both crawl it and index it”.
Dies klingt zunächst so, als ginge es bei ASEO primär darum, eigene Artikel überhaupt für Google Scholar & Co. auffindbar zu machen. Tatsächlich steckt jedoch mehr dahinter, schlagen die Autoren doch eine ganze Reihe formaler und inhaltlicher Mechanismen zur Artikeloptimierung vor, von denen mir einige äußerst sinnvoll, andere dagegen mit wesentlichen akademischen Prinzipien unvereinbar zu sein scheinen.
Welche Faktoren entscheiden über die Plazierung bei Google Scholar?
Grundsätzlich ist festzustellen, dass akademische Suchmaschinen nach anderen Regeln arbeiten, als man es von Google oder Yahoo kennt. So ist einer der zentralen Ranking-Faktoren bei Google Scholar die Anzahl der Artikel, welche auf die jeweilige Publikation als Quelle verweisen (vergleichbar vielleicht mit der Anzahl externer Links auf eine Webseite) – und auch der “gute Name” des publizierenden Journals oder Verlags kann in die Rankings einfließen. Andere Faktoren sind wiederum aus der “normalen” Suchmaschinenoptimierung bestens bekannt, so beispielsweise die sogenannte Keyword Density – die Frage, wie häufig und wie prominent (d.h. ob in Titel, Zwischenüberschriften, Abstract etc.) ein bestimmtes Schlüsselwort auftaucht. Und hier wird es knifflig, berührt dieser Punkt doch die Frage, inwiefern sich akademische Texte nach SEO-Kriterien “optimieren” lassen.
Ein Beispiel erklärt dies vielleicht am besten: Zum Stichwort “Augmented Learning” finden sich bei Google Scholar derzeit 496 Treffer, darunter auch ein Paper von meinen Kollegen und mir aus dem Tagungsband zur Photonics West 2007, welches jedoch nicht unter den ersten 30 Treffern (d.h. den ersten drei Suchergebnisseiten) landet und damit für jeden, der das Thema via Google Scholar recherchiert, so gut wie unsichtbar ist – es sei denn, sie oder er klickt sich durch sämtliche Suchergebnisse oder kennt zufällig einen der Autorennamen.
Eine Möglichkeit, die Position des Artikels zu verbessern, liegt in der Optimierung der Keyword Density. Im Titel (“Applying the Principles of Augmented Learning to Photonics Laboratory Work”) taucht der Begriff “Augmented Learning” zwar auf, nimmt aber nur 20% des Gesamttextes ein und steht nicht an erster Stelle – beides Faktoren, die das Ranking negativ beeinflussen können. Im Abstract taucht der Begriff sogar nur ein einziges Mal auf – auch hier ließe sich die inhaltliche Relevanz des Artikels für den Suchbegriff aus Sicht der Suchmaschinen also noch steigern.
Die “slippery slope” ist leicht erkennbar. Hätten wir unseren Artikel beispielsweise mit “Augmented Learning in Photonics” überschrieben und das Abstract anders formuliert, wäre er möglicherweise besser auffindbar – da man Titel und Formulierungen in der Regel aber nicht beliebig wählt, würde eine solche Vorgehensweise im Klartext bedeuten, zugunsten der späteren Sichtbarkeit des Artikels auf Titel und Formulierungen zu verzichten, die man ansonsten bevorzugen würde. Dass derartige Strategien, würden sie von vielen Autoren aufgegriffen, die sprachliche und inhaltliche Qualität der veröffentlichten Artikel mittelfristig nach unten drücken würden, scheint mir nicht unrealistisch zu sein.
Aber auch rein “akademische” Kriterien wie die Anzahl an Referenzen in anderen Papern bergen diesbezügliche Gefahren, da Google Scholar (noch) nicht zwischen Eigen- und Drittreferenzen unterscheidet. Und so empfehlen die Autoren Beel, Gipp und Wilde dann konsequenterweise auch, jeden eigenen Artikel mit thematischem Bezug grundsätzlich zu referenzieren, während sie von der – im Prinzip ja ebenso naheliegenden – Bildung von “citation circles” aus ethischen Gründen abraten.
Welche Rolle spielt Open Access?
Interessant ist in diesem Zusammenhang die Rolle von Open Access, über die auf den ScienceBlogs ja schon mehrfach leidenschaftlich diskutiert wurde. Da frei zugängliche Arbeiten (unabhängig von der Art ihrer Veröffentlichung) erwiesenermaßen häufiger zitiert werden liegt es nahe, dass sie auch bei akademischen Suchmaschinen langfristig besser abschneiden, da jede Referenz sich nicht nur positiv auf das Ranking auswirkt, sondern vor allem erst einmal die Wahrscheinlichkeit dafür erhöht, überhaupt indiziert zu werden.
The good, the bad and the ugly
Obwohl ich es grundsätzlich für legitim und auch wichtig halte, die Mechanismen, nach denen akademische Suchmaschinen arbeiten, einer näheren Betrachtung zu unterziehen und auch darüber nachzudenken, wie man eigene Arbeiten besser auffindbar macht, sind mir doch einige Vorschläge der Autoren sauer aufgestoßen, wenngleich auch zahlreiche gute Anregungen dabei waren. Ich habe daher nachfolgend einmal versucht, in aus meiner Sicht “legitime” und “illegitime” ASEO-Ideen zu trennen.
Gute Ideen
- Die Keyword-Angaben in einem Paper nicht mit dutzenden Begriffen füllen, sondern sich auf die Begriffe beschränken, welche die größte Relevanz für den Inhalt aufweisen.
- Wenn möglich Vektor-Grafiken vewenden, um Abbildungen für Suchmaschinen leichter erfassbar zu machen.
- Eigene Paper auf Plattformen wie SciPlore oder Academia hochladen (soweit rechtlich möglich), damit sie von akademischen Suchmaschinen indiziert werden können.
- Auf eine konsistente Schreibweise der Autorennamen achten (“Jörg” und “Joerg”) um es den Suchmaschinen zu erleichtern, Artikel einzelnen Autoren zuzuordnen.
Diskussionswürdige Ideen
- Neben den eigentlichen Fachbegriffen auch “gängige” Synonyme im Artikel erwähnen, um den Text auch für Laien leichter auffindbar zu machen.
Schlechte Ideen
- Vor der Festlegung eines Titels bzw. der Erstellung des Abstracts mit Hilfe von Tools wie Google Trends und Google Insights nach besonders “gefragten” Begriffen suchen.
- Titel, Zwischenüberschriften und Abstract darauf ausrichten, einen bestimmten Begriff bei Google Scholar & Co. möglichst gut zu “besetzten”.
- Jedes eigene Paper zum gleichen Thema auf jeden Fall in die Quellen aufnehmen, um die Referenzwerte der eigenen Arbeiten zu stärken, selbst wenn die zusätzlichen Referenzen inhaltlich nicht zum Artikel beitragen.
- Ältere Artikel in neuer, “optimierter” Fassung auf der eigenen Webseite veröffentlichen, da beispielsweise Google Scholar Artikel mit gleichem Titel gemeinsam indiziert und ältere Artikel auf diese Weise für Suchbegriffe gefunden werden können, die darin eigentlich gar nicht auftauchen. Immerhin lassen die Autoren hier schon selbst durchblicken, dass sie die Vorgehensweise für fragwürdig halten…
Warum mir die letztgenannten Ideen nicht gefallen, liegt hoffentlich auf der Hand. Beim Schreiben eines Papers oder Artikels sollte die Frage, wie gut dieser später via Google Scholar auffindbar ist, keine für Inhalt oder Formulierungen bedeutende Rolle spielen. Bei der Vorstellung, dass Titel, Zwischenüberschriften, Abstract und sogar der eigentliche Text akademischer Arbeiten zukünftig nicht mehr durch inhaltliche Überlegungen, sondern durch SEO-Kriterien bestimmt werden, stellen sich mir ein wenig die Nackenhaare auf, auch wenn ich etliche andere Vorschläge der Autoren für durchaus überlegenswert halte. Insbesondere scheint es mir wichtig, zwischen der aus meiner Sicht völlig legitimen Frage, wie ich Inhalte für akademische Suchmaschinen leichter indizierbar machen kann, und der weitaus weniger legitimen Frage zu unterscheiden, wie ein Paper umformuliert oder umstrukturiert werden könnte, um einen besseren Platz in den Suchergebnissen zu “erobern”.
Hinzu kommt eine Gefahr, die im Paper leider lediglich ganz am Rande erwähnt wird. Bereits einige wenige Autoren, die auf exzessive ASEO-Methoden setzen, könnten die Qualität der Suchergebnisse von akademischen Suchmaschinen ernsthaft beeinflussen, worauf diese wiederum mit Veränderungen in den Suchalgorithmen reagieren müssten.
So konnten noch vor einigen Jahren Webmaster, die auf “hidden keyword spamming” (die zigfache, “unsichtbare” Wiederholung von Suchbegriffen, z.B. in weißer Schrift auf weißem Hintergrund) setzen, die Suchergebnisse der “großen” Suchmaschinen massiv beeinflussen – inzwischen ist diese Technik jedoch verbrannt und entsprechende Webseiten werden von den Suchalgorithmen abgewertet. Gleiches wäre zumindest für einige Techniken (insbesondere die im betrachteten Paper vorgeschlagene Optimierung von Artikeln über verschiedene “Fassungen”) denkbar. Wer derartige Vorgehensweisen empfiehlt, sollte den Autoren dabei nicht verschweigen, dass ihre Artikel irgendwann vielleicht gänzlich im Orkus verschwinden, sollte die Technik je als “Spamming” eingestuft werden…
Alles in allem sehe ich bei ASEO mehr Schatten als Licht. Während ich es grundsätzlich begrüßen würde, wenn sich mehr Wissenschaftler Gedanken über die bessere Auffindbarkeit ihrer Arbeiten (z.B. via Open Access Publishing oder über suchmaschinengerechte Grafiken) machen würden, sehe ich auf der anderen Seite die Gefahr, dass die “SEO-Schraube” zu weit gedreht wird. Jede Form des Wettstreits um gute Scholar-Rankings würde – ähnlich wie dies im “regulären” SEO-Bereich schon lange der Fall ist – unerwünschte Techniken wie Keyword Spamming oder die irreführende Vergabe von Titeln begünstigen, wenn auch – aufgrund des “Spamfilters” Peer Review – sicher nicht in einem ähnlichen Ausmaß. Gerade in Preprint Repositories ließe sich aber auch losgelöst vom Peer Review “optimieren” – zumindest die könnten also Schiffbruch erleiden, sollten bestimmte ASEO-Techniken in der akademischen Gemeinschaft eine substanzielle Zahl von Anhängern finden…
Zum Weiterlesen – andere Meinungen zum Thema:
“Was Wissenschaftler von Webmastern lernen können” im scholarz.net-Blog
Paper die nicht in Google Scholar, CiteSeer, etc. gelistet sind, existieren für manche (viele?) Wissenschaftler gar nicht. Dementsprechend sollten sich Wissenschaftler ebenfalls die Fragen stellen: Wird mein Paper eigentlich von Google Scholar gefunden? Und indiziert? Und wenn jemand bei Google Scholar nach dem Stichwort XYZ sucht, steht mein Paper dann ganz oben in der Ergebnisliste? Und wenn nicht, wie kann ich das ändern?
“ASEO: An inevitable evil?” im Blog “Webometric thoughts”
Academic SEO should in no way effect how you write an academic paper, or the subjects we choose to write about. [Scientists] need to think seriously about doing worthwhile research and writing quality publications. If your focus is on SEO then you are in the wrong field.
Jöran Beel, Bela Gipp, & Erik Wilde (2010). Academic Search Engine Optimization (ASEO): Optimizing Scholarly Literature for Google Scholar and Co. Journal of Scholarly Publishing, 41 (2), 176-190 : 10.3138/jsp.41.2.176.
https://www.sciplore.org/publications/2010-ASEO–preprint.pdf
Kommentare (12)