Es war eine typische NASA-Aktion: Zuerst wurde angekündigt, dass es in ein paar Tagen eine Pressekonferenz geben würde, auf der man eine “record-breaking discovery” des Hubble-Weltraumteleskops vorstellen würde. Die fand gestern statt und das präsentierte Resultat läuft unter der Schlagzeile: “Record Broken: Hubble Spots Farthest Star Ever Seen”. Im Text tauchen PR-taugliche poetische Bezeichungen auf; im “Sunrise Arc” wurde der “Earendel”, der “Morning Star” entdeckt. Ein Stern, der so früh nach dem Urknall entstanden ist wie kein anderer Stern den wir bisher entdeckt haben. Das ist ohne jeden Zweifel eine wichtige, einmalige und sensationalle Entdeckung. Aber es lohnt sich auch, ein wenig hinter die Kulissen der Pressemitteilungen zu schauen. Bevor ein wissenschaftliches Resultat veröffentlicht wird, muss es begutachtet werden. Und dabei geht es mitunter ein wenig heftiger zu als die schicken und superlativ-lastigen Medienberichte zeigen.

Was wurde eigentlich entdeckt?

Fangen wir kurz mit der Wissenschaft an. Es geht um die Arbeit “A highly magnified star at redshift 6.2”. Erstautor ist Brian Welch von der Johns Hopkins University in Baltimore, 28 weitere Forscher_innen waren beteiligt. Der Fachartikel ist – soweit ich das sehe – leider nicht frei zugänglich, weswegen ich normalerweise nicht darüber schreiben würde. In dem Fall ist das aber anders, dazu mehr später.

Es geht um Daten die mit dem Hubble-Weltraumteleskop gewonnen wurden. Man hat einen Stern beobachtet, der so weit entfernt ist, wie kein anderer. Man muss hier natürlich aufpassen: Wenn es um wirklich große Distanzen geht, ist das Konzept der Entfernung in der Astronomie missverständlich. Wir leben ja in einem expandierenden Universum in dem das Licht nicht unendlich schnell ist. Wenn Licht sich von A nach B bewegt, braucht es Zeit und währenddessen dehnt sich das Universum weiter aus. Wenn wir also Licht beobachten, das sehr lange unterwegs war, dann sehen wir vor allem in die Vergangenheit. Wie weit wir auch in die Ferne sehen, ist eine Frage, die sich nicht eindeutig beobachten lassen. Das Licht des Sterns um den es geht, war 12,9 Milliarden Jahren bis zu uns unterwegs. Daraus folgt aber nicht, dass der Stern 12,9 Milliarden Lichtjahre weit weg ist – eben weil sich der Kosmos in all der Zeit immer weiter ausgedehnt hat. Daraus folgt auch nicht unbedingt, dass der Stern 12,9 Milliarden Jahre alt ist. Das Bild des Sterns ist so alt; der Stern selbst hat eine viel kürzere Lebensdauer. Wenn man einen Superlativ verwenden möchte, dann bietet sich “früheste” an: Der Stern ist der früheste der bisher beobachtet wurde. Er entstand, als das Universum gerade einmal 900 Millionen Jahre alt war und wir haben bis jetzt noch keinen Stern gesehen, der noch früher entstanden ist.

Das war die Entdeckung; was man sich da aber sofort fragt ist: Wie wurde das gemacht? Wenn das Licht so lange bis zu uns braucht; wenn es aus so großer Entfernung zu uns gekommen ist: Wie kann man das überhaupt sehen? Einzelne Sterne können wir ja nur in unserer eigenen Galaxie beobachten; beziehungsweise in den unmittelbaren Nachbargalaxien. Bei Spezialfällen kann das auch mal in Galaxien der erweiterten Nachbarschaft gelingen. Aber wenn es um Dimensionen von Milliarden Lichtjahren geht, dann kann man schon froh sein, wenn man eine komplette Galaxie als verwaschenes, dunkles Fleckchen sieht. Wie soll man da einen Einzelstern erkennen?

Das geht natürlich nur mit entsprechender Hilfe. In dem Fall war es ein kosmisches Vergrößerungsglas. Masse krümmt den Raum; Licht folgt der Raumkrümmung. Daraus folgt: Objekte im All können unter bestimmten Bedingungen mit ihrer Gravitationskraft wie eine Linse wirken und genau wie eine optische Linse Licht verstärken. In diesem Fall befindet sich der Stern in einer weit entfernten Galaxie und leuchte aus unserer Sicht enorm schwach. Zufällig steht aber von uns aus gesehen eine andere, sehr viel nähere Galaxie genau zwischen uns und der fernen Galaxie. Und zwar genau so, dass sie als “Gravitationslinse” wirken und das Licht der Hintergrundgalaxie verstärken kann. Dieses Phänomen ist nicht neu; es wird in der Astronomie schon lange und auf viele Arten ausgenutzt. In diesem Fall hat alles genau so zusammengepasst dass der Stern sich gerade an so einer Position befindet, wo die Vergrößerung der Gravitationslinse maximal ist. Nur deswegen konnte man ihn sehen.

Das ganze sieht dann so aus:

Der Bogen ist das durch die Gravitationslinse verzerrte Bild der Hintergrundgalaxie und wurde von den Autor_innen “Sunrise Arc” getauft. Darin erkennt man einen Lichtpunkt, der den Stern darstellt und den Namen “Earendel” bekommen hat, nach dem altenglischen Wort für “Morgenstern”. Und Earendel ist jetzt der neue Rekordhalter. Die Geschichte des bisher fernsten/frühesten Sterns habe ich übrigens in einer Podcastfolge schon mal ausführlich erzählt:

Die Begutachtung der Sensation

Jetzt haben wir also eine “Sensation” und jede Menge Medienecho. Wie gesagt, ich habe den Fachartikel selbst nicht gelesen, weil er nicht frei zugänglich ist. WAS man aber frei zugänglich findet, ist das “Peer Review File” (pdf). Und es lohnt sich, da mal reinzuschauen.

Zuvor aber noch ein kurzer Abriss über den wissenschaftlichen Publikationsprozess: Nachdem man eine Entdeckung gemacht hat oder ein wissenschaftliches Result erhalten hat, schreibt man das ganze auf und schickt es an eine Fachzeitschrift zur Publikation. Dort gibt es dann Editoren, die beurteilen müssen, ob das etwas ist, dass sich für die Zeitschrift eignet und vor allem, ob das alles wissenschaftlich seriös durchgeführt worden ist. Dazu sucht man sich “Referees” bzw. “Reviewer”, also Leute, die ausreichend viel Wissen um die Inhalte detailiert begutachten zu können. Das sind keine fix angestellten Menschen; das sind einfach irgendwelche anderen Wissenschaftler_innen. Als Editor schaut man wer geeignet sein könnte; wer schon zum gleichen Thema publiziert und Ahnung davon hat und bittet die Leute dann, ein Gutachten zu schreiben. Das macht man im Allgemeinen auch, wenn man gefragt wird. Es ist zwar freiwillige und unbezahlte Arbeit. Aber wenn man selbst irgendwann etwas an eine Zeitschrift schickt, möchte man ja auch, dass es sinnvoll und gut begutachtet wird. Also lehnt man selbst die Anfrage zu einem Gutachten normalerweise nicht ab (es sei denn man hat keine Ahnung vom Thema). Üblicherweise werden zwei bis drei Gutachten eingeholt, in besonders umstrittenen oder spektakulären Fällen können es auch schon mal vier sein.

Die Gutachter_innen geben dann also ihre Meinung ab. Sie können entweder sagen: “Passt alles, genau so veröffentlichen”. Das kommt so gut wie nie vor. Oder sie sagen: “Alles Quatsch, bitte die Publikation sofort ablehnen”. Das kommt schon öfter vor, aber immer noch eher selten. Üblicherweise stehen in so einem Gutachten dann diverse kleine und größere Anmerkungen und Korrekturhinweise. Das reicht von Kleinigkeiten wie “Bitte die Beschriftungen auf den Diagrammen etwas größer machen?” über “Könnte man diesen Teil bitte noch ein wenig ausführlicher erklären?” bis hin zu gröberer Kritik wie “Ich glaube, da wurde eine Methode benutzt die nicht ganz passend ist – man sollte das noch mal mit einer anderen Methode probieren und schauen, was da dann rauskommt”. Man kriegt dann die gesammelten Gutachten zugeschickt und antwortet darauf. Entweder in dem man die Vorschläge aus dem Gutachten umsetzt (was sehr nervig sein kann, wenn man ganze Beobachtungsreihen oder Analyseschritte wiederholen muss). Oder in dem man probiert zu argumentieren, warum man das nicht tun muss. Am Ende liegt es dann im Ermessen der Editoren der Zeitschrift zu entscheiden, ob die Kritik aus den Gutachten gerechtfertigt ist oder nicht und ob die die Autor_innen sie bei der Überarbeitung ausreichend berücksichtigt haben oder nicht. Je nachdem wird der Artikel dann publiziert. Oder nicht.

Dieser Prozess kann dauern. Die Arbeit über den frühesten Stern wurde am 28. Juli 2021 bei der Fachzeitschrift “Nature” eingereicht. Und es hat bis 20. Januar 2022 gedauert, bis sie zur Publikation angenommen wurde. Und oft dauert es noch viel länger als ein halbes Jahr… Aber dieser Prozess ist auch notwendig; der “Peer Review” ist die beste Methode die wir haben, um sicherzustellen, dass nicht allzu viele falsche/fehlerhafte Ergebnisse publiziert werden.

Reviewer #2 schlägt zu

Alle die schon mal wissenschaftlich publiziert haben, wissen wie nervig es ist, wenn man ein Gutachten bekommt. Man selbst ist ja überzeugt, dass man alles nach besten Wissen und Gewissen richtig gemacht hat. Und dann kommen da so doofe Reviewer und wollen dies geändert haben und jenes genauer erklärt! Aber wenn man den Ärger mal runtergeschluckt hat, macht man sich dann meistens doch an die Verbesserungen. Weil man weiß, dass man sich selbst auch täuschen kann; weil man Fehler macht, die einem nicht auffallen. Aber anderen und am Ende wird der Fachartikel durch die Gutachten meistens besser als vorher. Trotzdem ärgert man sich über die Reviewer. Ganz besonders über “Reviewer #2”. Witze über “Reviewer #2” sind in der wissenschaftlichen Community weit verbreitet. Oft kriegt man ein Gutachten, das so halbwegs ok ist und eines, dass sehr viel mehr Korrekturarbeit nötig macht. Und dann sieht man sich wieder mal bestätigt, dass der mysteriös Reviewer #2 ein richtiger Fiesling ist.

Nun, im Fall von Earendel, dem “Morgenstern” ist Reviewer #2 tatsächlich nicht so begeistert von der Sache. Früher wurden die Gutachten nicht öffentlich gemacht; heute passiert das ab und zu und diese Transparenz ist natürlich spannend. Man kann sich ganz genau ansehen, was den Reviewern an der Arbeit über den “frühesten” Stern nicht gefallen hat und wie die Autor_innen darauf reagiert haben. Ich habe mir das mal im Detail angeschaut.

Insgesamt gab es hier vier Reviewer. Nummer 4 ist genau die Art von Person, mit der man die meiste Freude hat. Kaum Anmerkungen, nur ein bisschen formale Kritik die sich schnell erledigen lässt:

“The authors’ analysis is thorough and convincing, and the paper clearly presents the data, methodology, and reasoning behind their conclusions. I do have some minor comments on the paper that I think would help clarify and strengthen certain points.”

Reviewer #3 ist auch nett:

“I have read the paper […] with great interest and enjoyment, and would like to congratulate the authors on their discovery and a very nice paper.”

Da gibt es zwar schon ein paar ausführlichere Anmerkungen und die Bitte, ein paar Punkte genauer auszuführen. Aber auch nichts, was einem sonderlich viel Arbeit macht.

Reviewer #1 ist ein Beispiel für ein typisches Gutachten. Sehr viele Anmerkungen; viele davon betreffen formale Aspekte des Artikels oder Kleinigkeiten; ein paar größere Sachen sind aber auch dabei. Man hat mit so einem Gutachten durchaus Arbeit, aber am Ende auch das Gefühl, dass es sich gelohnt hat. Reviewer #1 fand zum Beispiel den ursprünglichen Titel der Arbeit ein wenig zu übertrieben. Der lautete “An Extremely Magnified Individual Star Observed in the First Billion Years” und der Kommentar dazu:

“Please change it to something more efficient along the lines of ‘An extremely magnified star at redshift z = 6.2’. Sometimes less is more.”

Dem Vorschlag ist man dann ja offensichtlich auch gefolgt. Reviewer #1 hatte auch noch umfassendere Kritik, die aber immerhin sehr höflich vorgetragen wurde:

“Not to be unkind, but you will have to tone down your claim that Earendel presents an opportunity to study a low-metallicity star because you have no real idea of its metallicity, just one based on a reasonable model.”

Dabei geht es um die Frage, ob Earendel ein Stern mit geringer “Metallizität” ist, also ein Stern, der kaum andere Elemente als Wasserstoff und Helium enthält. Ursprünglich scheinen Welch & Co erklärt zu haben, dass das auf Earendel zutrifft und haben ihn als Ausgangspunkt für umfassende Studien dazu präsentiert. Das dürften die Daten aber nicht hergegeben haben.

Bis jetzt bewegt sich alles im Rahmen eines üblichen Begutachtungsprozesses. Wenn da nicht Reviewer #2 wäre. Der/die fand die Arbeit so richtig, richtig doof… Hier ein paar Ausschnitte:

“There is insufficient data for useful conclusions.”

“A prime example of how not to do statistical analysis with model comparison.”

“There is no scientifically useful conclusions based on the available data and theoretical models.”

“Pointless speculation that are wrong (summary) and/or uninteresting (abstract).”

Am härtesten ist aber fast dieser Kommentar:

“I think it is unfair to your colleagues to send such a paper for review.”

Im Detail stört sich Reviewer #2 daran, dass Earendel als Stern mit niedriger Metallizität präsentiert wird (so wie Reviewer #1). Außerdem hält er die aus theoretischen Modellen abgeleiteten Eigenschaften des Sterns für so ungenau, dass sie keinen Sinn machen. Was man nicht ganz von der Hand weisen kann: Die Oberflächentemperatur von Earendel wird im Artikel etwa mit 8.000 bis 60.000 Kelvin angegeben, was mehr oder weniger das gesamte Spektrum der heißen Sterne umfasst. Reviewer #2 nennt das “”ridiculously uncertain”. Und ist auch im weiteren nicht unbedingt bemüht, seine Kritik sonderlich höflich auszudrücken:

“The star is so distant, it can’t be really studied in any meaningful way with these observations: You do not know metallicity. You estimate temperature up to about 1 dex uncertainty. You do not know multiplicity of the star by 0.6 dex (factor 4). SO you are really trying to tell the reader you can learn something about evolution of low-metallicity stars form this? This is an insult to the readers’ intellect.”

Auch die Schlussfolgerungen stören Reviewer #2:

“A statement of the kind “X is consistent with … ” has not merit as it does not constrain what is not consistent. Not having a bank statement to show for it is consistent with being a billionaire.”

Der angesprochene Punkt ist durchaus relevant. Wie kann man sich sicher sein, dass man da wirklich einen einzelnen Stern sieht? Die Autor_innen sagen tatsächlich, dass es sich auch um einen Doppelstern handeln könnte. Aber Reviewer #2 möchte halt nicht nur wissen, zu welchen Hypothesen die Daten passen, sondern auch zu welchen sie ganz explizit nicht passen. Wenn es sein Stern sein kann, dann sollte man auch ausschließen, dass es etwas anderes als ein Stern sein könnte; nur dann kann man halbwegs berechtigt behaupten, man hätten einen Stern beobachtet. Und laut Reviewer #2 geben die Daten so eine Aussage nicht her.

Ebenfalls genervt ist Reviewer #2 von den Spitznamen (“Earendel”, “Morning Arc”) die im Artikel vergeben wurden:

“[N]aming of astronomical objects is sole IAU authority. Hence any reference to fantasy names “Sunrise Arc” and “Earendel” need to be removed.”

Das ist nicht ganz falsch. Tatsächlich kann nur die Internationale Astronomische Union verbindliche Bezeichnungen für Himmelskörper vergeben. Andererseits ist es durchaus üblich, dass Forscher_innen Spitznamen für ihre Forschungsobjekte vergeben und die dann auch benutzen. Aber gut, wenn man als Reviewer schon genervt von der ganzen Arbeit ist, dann sucht man sich auch noch diverse Kleinigkeiten, die man kritisieren kann. Vor allem in so einem Fall, wo man Objekte ganz besonders PR-tauglich benennt, von deren Existenz man als Reviewer alles andere als überzeugt ist…

Reviewer #2 endet mit dem Fazit:

“So there is hope for data in the future of which the present paper is devoid.”

Was ist denn jetzt mit der Entdeckung?

Was sagt uns dieser Einblick in den Begutachtungsprozess? Erstmal, dass in der Wissenschaft auch nur Menschen arbeiten die genau so menschlich und heftig diskutieren wie das anderswo passiert. Zweitens, dass der wissenschaftliche Begutachtungsprozess keine Formalie ist; da wird wirklich genau hingeschaut; da wird kritisiert und wenn einem was nicht gefällt, dann wird das auch gesagt. Drittens: Dass ein vernichtendes Gutachten nicht unbedingt das Ende einer Publikation bedeuten muss. Am Ende entscheiden die Editoren der Zeitschrift, was sie mit dem Gutachten anstellen. In dem Fall waren offensichtlich die drei positiven Gutachten überzeugender als das eine negative. Wir wissen ja auch nicht, was abseits des offiziellen Begutachtungsprozesses noch passiert ist. Vielleicht und sehr vermutlich gar nichts. Aber Peer Review ist manchmal auch kompliziert. Oft ist die Gruppe derjenigen Personen die ausreichend viel Ahnung vom Thema haben sehr klein. Dann wird es auch zwangsläufig so sein, dass Autor_innen und Gutachter_innen sich auch persönlich kennen. Und vielleicht auch mal ganz persönlich nicht mögen. Oder in wissenschaftlicher Konkurrenz stehen. Wenn den Editoren – die ja als einzige immer alle Beteiligten kennen (Gutachten werden im Allgemeinen anonym verfasst) – so etwas wissen, können sie Gutachten natürlich entsprechend gewichten.

Ich selbst bin kein Experte auf diesem Gebiet, kann also nicht beurteilen, wie gut die wissenschaftlichen Daten tatsächlich sind. Die Entdeckung von Earendel (oder “WHL0137-LS”, wie die offizielle Bezeichnung lautet, die die Autor_innen dann aufgrund der Gutachten doch noch einfügen mussten) ist tatsächlich bedeutsam. Die Astronomie ist schon lange auf der Suche nach den “ersten” Sternen. Also der Sterngeneration, die als erste nach dem Urknall entstanden ist, als es im Universum tatsächlich nur Wasserstoff und Helium und sonst nichts gab.

Die zu finden ist schwer bis unmöglich, aber Earendel könnte ein Schritt auf dem Weg dorthin sein. Zum Glück müssen wir aber nicht mehr so lange warten, bis in diesem Fall mit Klarheit zu rechnen ist. Das James-Webb-Weltraumteleskop wird in den nächsten Monaten einsatzbereit sein und mit Sicherheit sehr bald sein großes Auge auf den potenziell frühesten Stern werfen. Die entsprechenden Ergebnisse werden uns sagen, was dort wirklich zu finden ist. Vorausgesetzt natürlich, Reviewer #2 hat nicht zu viel an der Arbeit zu meckern 😉

Kommentare (11)

  1. #1 Spritkopf
    31. März 2022

    Einen Link auf das Originalpaper gibt es hier.

    (Wenn die Verlinkung nicht ok ist, dann lösche meinen Kommentar.)

  2. #2 RPGNo1
    31. März 2022

    Ein bisschen Erbsenklauberei: In der Überschrift fehlt bei “Spekultion” fehlt noch ein a zwischen l und t. 🙂

  3. #3 Henning
    31. März 2022

    Dass man Review-Einladungen normalerweise annimmt, ist eher falsch. Es kommt eine solche Flut, dass ich mindestens 2 Drittel ablehne, manche Kollegen zwischen 95 und 100 Prozent.
    Das macht den Job des Editors nicht leicht, aber man kann halt auch nicht 28 Stunden am Tag reviewen.

  4. #4 Ben Schäfer
    31. März 2022

    @RPGNo1 Da ist er wieder, der Reviewer #2!!!

    😀

  5. #5 Florian Freistetter
    31. März 2022

    @Hennig: “Es kommt eine solche Flut, dass ich mindestens 2 Drittel ablehne, manche Kollegen zwischen 95 und 100 Prozent.”

    Ok, das stimmt natürlich. Was ich eigentlich gemeint habe: Reviewen gehört zum Job dazu; das verweigert man nicht aus Prinzip. Das man zeitlich nicht alles schafft, was man gefragt wird ist ne andere Geschichte.

  6. #6 schlappohr
    31. März 2022

    Den Vogel abgeschossen hatte Reviewer#2 vor einigen Jahren bei einem Paper aus dem Bereich Prozessorarchitekturen, dass meine Gruppe eingereicht hatte. Sinngemäß hieß es: Muss man wirklich aus jedem sch*ß Engineeringjob in Paper machen? Der Rest der Review ließ darauf schließen, dass der Reviewer das Paper wahrscheinlich nicht gelesen, ganz sicher aber nicht verstanden hat. Genutzt hat uns das nichts, es wurde abgelehnt (zumindest auf dieser Konferenz.)

    Zugegeben, bei bestimmten Papern fällt es schwer als Reviewer höflich zu bleiben. Manche Werke würden nicht mal Seminararbeit in der 10. Klasse durchgehen (das ist zum Glück eher selten). Besonders erfreulich sind solche Paper, die man in der Review mit “Requires major rework” bewertet, und dann ein Jahr später in fast unveränderter Form noch einmal auf den Tisch bekommt.

    Wie auch immer, Peer Review ist ein Werkzeug zur Qualitätssicherung, nicht zur Selbstdarstellung. Als Reviewer verpflichtet man sich, den Autoren klar zu machen, dass ihre Arbeit nichts taugt, wenn sie nichts taugt. Es ist aber kontraproduktiv und unsachlich, sich dabei im Ton zu vergreifen.

  7. […] “Sinnlose Spekultion”: Die Entdeckung des “Morgensterns” und Einblicke in den wissenschaftli… […]

  8. #8 Thomas N.
    1. April 2022

    Ich habe eine Frage, hoffentlich habe ich die Antwort darauf nicht übersehen.
    Warum ist es genau der zweite Reviewer, der besonders kritische Anmerkungen macht? Ist das im Prozess begründet oder eher Zufall?

  9. #9 Matthias
    SC, USA
    4. April 2022

    Ich weiss, dass ich hier ein bisschen spaet dran bin mit meinem Kommentar, aber (das mit den Reviews war schon sehr interessant!) “wie eine optische Linse Licht verstärken” stimmt doch so nicht, oder? Eine Linse kann Licht streuen oder buendeln, aber nicht “verstärken”? Bin ich jetzt Reviewer #2? ;P

  10. #10 echt?
    4. April 2022

    “Wenn es sein Stern sein kann”. Vielleicht besser noch ein “s” löschen.

  11. #11 Wizzy
    4. April 2022

    Gibt es jetzt gegenüber Reviewer #2 ein Update, dass es wirklich ein Stern sein sollte, oder kann das Objekt immer noch auch genau so gut ein Sternhaufen / Galaxienkern o.ä. sein?