Weniger Mädchen um Atomzwischenlager Gorleben! Ein signifikanter Unterschied, und er glaube nicht an einen Zufall, sagte Ralf Kusmierz dem NDR. Ist da irgendetwas dran?

Stutzig machen muss ja schon, dass weder die Zahlen genannt noch die Studie verlinkt ist. Dass eine Suche nach den Autoren Hagen Scherb und Kristina Voigt vor allem Anti-Atom-Agitationsseiten zu Tage fördert die gierig die offenbar regelmäßig herausgegebenen Meldungen dieser Art wiedergeben. Unkritisch, versteht sich. Ein Blick in das NDR-Forum lässt dann schnell die Zweifel wachsen: Da finden sich gleich Leute, die anscheinend die Studie gefunden haben und festgestellt dass die angebliche signifikante Änderung 120:111 männliche gg weibliche Neugeborene betrifft. Eine lächerliche Statistik (die rate ist übrigens sowieso nicht 1:1, sondern eher 51:49). Ich würde mir das trotzdem gerne mal direkt ansehen, aber leider funktionieren die Server des Helmholtz-Zentrums München* nicht, jedenfalls kann ich seit Tagen die PDFs nicht erreichen.
Ich würde das aber gerne selbst sehen. Wenn jemand in einem Interview etwas behauptet, dann ist das bedeutungslos. Ich muss ihm nicht glauben. Wenn es aber so eine steile These ist, dann möchte ich es selbst überprüfen, und das steht in der echten wissenschaftlichen Publikation. Ich möchte auch nicht, dass mir jemand meine Forschungsresultate glaubt, weil ich sage was ich herausgefunden habe. Ich will, dass er meine Methoden, Daten und Ergebnisse ansieht und sich davon überzeugen lässt. Nur so kann Wissenschaft funktionieren.
ResearchBlogging.orgAlso begebe ich mich auf die der Suche nach echter Literatur (also veröffentlichten, peer-reviewten Papern), und finde ein Paper von 2007 von Hagen Scherb und Kristina Voigt, das in europäischen Geburtenraten nachschaut, ob das Tschernobyl-Unglück eine Verschiebung der Geburtenraten in Deutschland und Europa verursacht hat.

Die Hypothese

Die Basis jeder wissenschaftlichen Arbeit bildet eine gute Arbeitshypothese. In diesem Fall befassen wir uns mit dem Gedanken, dass Umwelteinflüsse Auswirkungen auf genetisch vererbte Merkmale haben können, speziell radioaktive Strahlung. Grundsätzlich kann Strahlung Verschiebungen in den Geschlechtern auslösen, wenn Mutationen auf dem X-Chromosom tödliche Gene erzeugen. Eine rezessive mutiertes Gen in Müttern würde z.B. nur männlichen Nachwuchs schaden, da die Töchter durch ein zusätzliches X geschützt werden. Der Zusammenhang ist aber keineswegs einfach, da er davon abhängt ob Mütter oder Väter stärker der Strahlung ausgesetzt sind. Die Richtung der möglichen Verschiebung in den Geschlechtern lässt sich also nicht ohne weiteres vorhersagen.
Die Hypothese, auf der die Arbeit von Scherb&Voigt basiert, ist aber spezieller. In früheren Arbeiten wurde aus Beobachtungen die Verschiebung zu mehr männlichen Geburten in der europäischen Nachbarschaft von Tschernobyl postuliert. Die Studie möchte nun Länder in ganz Europa in den Geburtenraten nach einem solchen Trend suchen.
Die Arbeitshypothese würde ich also als ausreichend motiviert bezeichnen; gerade solch ein großes Unglück bietet dann die Chance, eine ungewünschte große Statistik aufstellen zu können.

Sprunghafte Linien

Das Unglück von Tschernobyl geschah im April 1986, es müsste eine solche Verschiebung in der Geschlechterverteilung bei den Geburten also für 86/87 zu finden sein. Daher haben sich Scherb und Voigt die Geburtenraten aus europäischen Ländern (Tschechei, Dänemark, Finnland, Deutschland, Ungarn, Norwegen, Polen und Schweden, also ost- zentral- und nordeuropäische Länder) von 1982 bis 1992 angesehen, und als Größen für die Analyse den Anteil an männlichen Geborenen (liegt um 0.51) und die gemessene radioaktive Strahlenbelastung aus Cs-137-Messungen.
In den nach Ländern aufgetrennten Zeitserien der Geburtenrate wurde zunächst ein Trend gesucht:

i-2a799f9e1a8df0dbece0c2aa80351b1c-scherb1-thumb-400x483.png
Reproduziert nach Scherb&Voigt 2007

Wie man sieht, wurde zunächst ein linearer Trend an die Daten gefittet (vergessen wir erstmal den Sprung). Dieser zeigt eine leicht abnehmende Tendenz, also eine langfristige Verschiebung zu mehr Mädchengeburten. Ob dieser Trend jedoch “echt” ist, ist schwierig zu sagen. Solch einen Trend an lediglich 10 Jahre zu fitten ist nicht sonderlich aussagekräftig, und erinnert ein wenig an die Bemühungen der Klimawandelleugner, einen Nicht-Erwärmungs-Trend seit 1998 auszumachen. Die Fähigkeit, einen solch kleinen Trend zu messen hängt am Verhältnis Signal zu Rauschen. Und wenn man sich das Rauschen ansieht, also die Sprünge die die Kurve macht, dann würde ich einfach mal sagen dass hier das Rauschen den Trend völlig überdeckt. Ich verstehe hier nicht die Wal der Jahre 1982-1992. Ich würde vermuten, dass es kein großer Zusatzaufwand wäre, eine längere Zeitreihe zu erhalten wenn man schon diese Daten bekommt, und den linearen Trend mal an 20-30 Jahre zu fitten.
Leider ist es online nicht ohne weiteres möglich, an diese Zeitreihen zu kommen, vor allem aufgeteilt nach Geschlecht, sonst hätte ich das schnell versucht. Mal sehen, vielleicht besorge ich mir die Reihen noch, oder hat jemand die zufällig? Wäre mal interessant zu sehen, was noch von diesem Trend übrig bleibt.

Aber wie auch immer, zentral ist eine andere Sache hier: Dass die gefittete Kurve noch einen Sprung zwischen 1996 und 1987 enthält. Leider ist der Methodenteil sehr dünn und ich weiß nicht genau wie der Sprung berechnet wird, womöglich proportional zur Strahlenbelastung. Verwunderlich ist aber schon, wie man noch einen zusätzlichen Sprung in 1986/7 festsetzt, wenn ein solcher doch eigentlich das ist was man suchen möchte. Entschuldigt mich einen Moment.

Schritte nach draußen. Türe schließt.OH MEIN GOTT WAS MACHEN DIE DENN DA???Türöffnen. Schritte.

So da bin ich wieder. Wenn man sich die Kurven so anschaut, findet man schon einen Sprung in 1987, vor allem in den osteuropäischen Ländern und Deutschland. Allerdings finden sich ohne weiteres Sprünge, die ebenso groß sind, nach oben oder nach unten. Dass also in 1987 etwas Besonderes passiert sei, lässt sich aus dem Kurvenverlauf nicht vermuten. Diese zusätzliche Information jetzt dort hineinzustecken ist fragwürdig.
Hier wäre mein Vorschlag: Man fittet eine Kurve, die in einem Jahr einen Sprung machen darf, nach oben oder unten. Dann fittet man blind: Man gibt nicht das Jahr des Sprungs vor, sondern lässt das mögliche Sprungjahr über den gesamten Zeitraum variieren und schaut, wo ein solcher Fit ein besonders gutes Ergebnis gibt. Würde dabei rauskommen, dass mit einem Sprung in 1987 tatsächlich bessere Fits herauskommen würden als mit einem nur linearen Trend, wäre dies wohl eine Aussage mit ein wenig Kraft. Allerdings ist ja hier der lineare Trend schon fragwürdig, aber das zusätzliche Modell würde noch einen Freiheitsgrad, einen weiteren freien Parameter, einführen und dies müsste in der Bewertung, ob linearer Trend oder Sprungmodell besser passen, berücksichtigt werden. Hier könnte z.B. eine Maßzahl wie das Bayesian Information Criterion (BIC) helfen, die Modelle mit mehr Parametern zusätzlich bestrafen. Die Art, wie hier diese Kurve unkritisch einfach so gefittet werde, finde ich sehr gedankenlos.
Im Folgenden werden diese Kurven noch für alle europäischen Länder insgesamt gezeigt (mit 22 Millionen Geburten immerhin eine gute Statistik), und nur für die ostdeutschen Gebiete und Bayern:

i-ef8d53e4bee8d56b425b2e0ac0dffc25-scherb2-thumb-400x135.png
Reproduziert nach Scherb&Voigt 2007

Ha, da ist der Sprung doch gleich viel deutlicher und sticht gerade für Europa klar heraus! Aber Vorsicht, die y-Achse ist anders skaliert. Statt von 0.508 bis 0.518 geht sie nur noch von 0.512 bis 0.516. Ich erkenne keinen Grund, die Skalierung hier zu verändern, außer dass der Sprung so visuell beeindruckender erscheint. Aber warum ist z.B. Polen in den ersten Plots nicht auch so skaliert? Oder Deutschland? Die Ländergraphen haben eine interne konsistente Skalierung der y-Achse, und ich finde es wäre Aufgabe der Reviewer und des Editors gewesen, zu verlangen, diese in der zweiten Grafik fortzuführen. Oder wenigstens in Bildunterschrift oder Text darauf hinzuweisen, denn so übersieht man es beim schnellen Anschauen des Papers zu leicht.
Hier stellt sich weiterhin die Frage, wie die Autoren es rechtfertigen, des Trend in 1987 einzeln zu analysieren. Was ist in Deutschland 1984 passiert, gab es dort Antistrahlung?
Das ist natürlich polemisch, aber mein Punkt ist, dass ein einzelner Sprung in einer offensichtlich verrauschten Zeitserie nicht interpretierbar ist, und dass es ehrlich ist das auch nicht zu tun wenn man eine Vermutung hat, welches Einzelereignis das verursacht haben könnte. Anders herum müsste es sein: Wenn die Strahlenbelastung eine deutliche Verschiebung erzeugt hätte, müsste das Signal über dem natürlichen Untergrund deutlich auszumachen sein. Wenn hingegen das Signal nur schwach sei, dann müssen die anderen möglichen Ursachen für Sprünge ebenfalls einbezogen werden und die vorliegende Methode ist zu einfach. Aus den gezeigten Kurven ist keine Entscheidung möglich, ob oder ob kein Sprung in 1987 vorliegt.

Korrelation und Kausation

Im folgenden behandeln Scherb&Voigt dann den Hauptpunkt ihrer Arbeit, die Untersuchung ob die Strahlenbelastung den Sprung verursacht hat. Dazu gehen sie dann jetzt tatsächlich einmal so vor, dass sie ein Modell bauen dass für eine bestimmte Zeitperiode eine zusätzliche Strahlendosis berücksichtigt und mit einem Faktor in die Regression der Geburtenrate einbaut. Ich kann leider nicht beurteilen, ob dies aus Sicht ökologischer Modelle Sinn macht, mir kommt es irgendwie seltsam vor dass nur für einen begrenzten Zeitraum eine Strahlendosis angenommen wird. Warum kann man nicht gleich die Zeitserie von Geburten und Strahlenbelastung korrelieren? Nun gut, es ist wohl, um das Signal in der Zeitserie wiederzufinden, aber wenigstens ich finde diesen Ansatz fragwürdig.
Auch die Strahlenbelastungsdaten (die in obigen Plots über den Graphen stehen) würde ich interfragen. Es wird wohl mit der mittleren Belastung gearbeitet, aber wenn z.B. Deutschland mit 2-16 kBq/m² den gesamten Rahmen der anderen Länder abdeckt, wie gut ist dieses Maß dann, gerade im Vergleich zu Ländern für die s nur einen Wert gibt?
Wie dem auch sei, Modelle die für ein Jahr eine zusätzliche Dosis annehmen, zeigen tatsächlich eine fast signifikante Korrelation zu den Schwankungen in der Geburtenrate 1986 und 1987. Für 1991 ergibt sich erstaunlicherweise eine stärke Abweichung in der Geburtenrate, die aber einen höheren p-Wert hat (vermutlich weil hier einfach wenig zusätzliche Strahlenbelastung vorlag). Signifikant wird die Korrelation, wenn man 1986 und 1987 als Periode zusätzlicher Belastung erlaubt. Weiterhin frage ich mich aber, welche Aussagekraft ein p-Wert hat, wenn das Modell quasi so gebaut ist dass nur in Fenstern in denen es zusätzliche Strahlung gibt eine Korrelation existieren kann.
Es folgt noch ein genialer Plot, der die Korrelation zwischen Strahlenbelastung und Geburtenrate auf kleinere Ebene (Distrikte) angibt. Die Größe der Bälle entspricht der Bevölkerungszahl – wobei nicht klar ist ob der Fit der Kurve damit gewichtet wurde:

i-41b6887fb8b688471f741aed38635d6e-scherb3-thumb-400x378.png

Die Steigung scheint stark durch die wenigen Punkte hinten beeinflusst zu sein. An die Punktwolke vorne könnte man vermutlich auch die Börsenkurse von letzter Woche fitten. Das führt dann auch zu Sätzen wie “This non-adjusted, purely spatial analysis yields an even somewhat stronger association of male proportions and fallout”. Even somewhat stronger…und das als ein eh schon fragwürdiger Trend.
Ferner muss man natürlich auch nochmal festhalten: Selbst eine gute Korrelation würde noch nicht bedeuten, dass die Strahlung denn auch die Ursache wäre. Nur eine größere Zahl unabhängiger Studien mit der gleichen Korrelation würde das Vertrauen darin stärken können.

Diskussion

Die Diskussion im Paper beschränkt sich dann auch auf die Feststellung, dass die Messdaten mit einem generell abnehmenden Trend mit Sprung in 1987 konsistent sei. No shit Sherlock, bei dem Rauschen soll man auch mal finden dass das nicht sein kann. Ich will ja nicht sagen, dass es keinen Sprung in 1987 gab oder die Hypothese widerlegt sei, es ist einfach so dass die Studie nicht stark genug ist, irgendetwas für oder gegen die Hypothese zu sagen. Und da sagen uns Occams Rasiermesser und Diax’s Rake, dass wir dort kein Signal annehmen sollten.
Erstaunlich ist, dass der Großteil der Diskussion dann wieder Studien aufführt, die eine Veränderung der Geschlechterverteilung durch Strahlung plausibel machen. Das gehörte eigentlich in die Einleitung, und nicht in die Diskussion der Ergebnisse. Ich muss mal böse anmerken, dass Scherb und Voigt hier einfach nicht mehr zu sagen hatten und Füllmaterial brauchten.Gar nicht einverstanden bin ich mit den Schlussworten:

In conclusion, time trend analyses and spatio-temporal analyses of German and European birth statistics revealed certain disturbances of the sex odds after the Chernobyl accident.

Nein, absolut nicht, es konnte keine Störung der Zeitserie nachgewiesen werden. Sie kann nicht ausgeschlossen werden, aber das ist es auch schon. Siehe oben.

These results add evidence to related more recent findings in the field of radiation epidmiology […referenzenliste…] and cast doubt on the official assessment of the so called “low level” ionizing radiation by pertinent national and international instituions.

Schade, bis jetzt war es nur ein eher aussageschwaches Paper, aber die kräftige Behauptung, ja fast Verschwörungstheorie, dass offizielle Angaben zur schwachen Strahlenbelastung in Zweifel zu ziehen seien wertet dieses Paper doch sehr stark ab.

Zurück nach Gorleben

Und leider scheint das sich durch die weitere Arbeit von Scherb&Voigt zu ziehen. Wenn wir auf die NDR-Studie zurückkommen behaupten die Autoren dort – im Interview wohlgemerkt, ein Paper dazu gibt es ja nicht, höchstens einen internen Bericht oder ein Abstract das ich nicht bekommen – dass ein Geschlechterverhältnis von 120:111 im Umkreis von Gorleben kein Zufall sein könne. bemerkenswert ist, dass sie im besprochenen Paper früheren Studien mit einer Statistik von “nur” 100000en noch bestätigen, nur geringe Aussagekraft bezüglich einer Verschiebung von 1.06 auf 1.08 zu haben. Über die Gültigkeit der p-Werte wurde im NDR-Forum diskutiert, das ist auch nicht meine Stärke – ich denke dass man sieht dass diese Aussagen hier noch weit jenseits der Ergebnisse der obigen Studie sind. Kein Wunder, dass die “Veröffentlichung” eher über NDR und andere Medien geschieht, anscheinend auch systematisch. Ich möchte nicht die wissenschaftliche Integrität der Autoren angreifen, aber ich würde mir doch bei solch komplexeren Fragestellungen wünschen, dass die Autoren sich den selbstregulierenden Kräften der Wissenschaft stellen, bevor sie solch starke Aussagen treffen.
Und das wichtigste habe ich ja noch gar nicht erwähnt – mit Tschernobyl steht ja unzweifelhaft tatsächlich ein Antrieb für mögliche Verschiebungen da – eine eindeutige zusätzliche Strahlenbelastung. Um Gorleben und Asse jedoch wird keine erhöhte Belastung gemessen. Zwar ist schwache zusätzliche Belastung durchaus nicht einfach festzustellen; aber dadurch bricht auch, abgesehen von der miserablen Statistik, auch die Arbeitshypothese weg. Ich hoffe ja mir die tatsächliche Studie noch ansehen zu könne, aber an dieser Stelle ärgere ich mich wirklich. Nicht nur über die Autoren, die hier durch ihre Studien nicht gestützte Aussagen treffen, sondern vor allem auch über die Atomkraftgegner die blind alles bejubeln dass ihr einfältiges Weltbild bestätigt und vor allem über eigentlich seriöse Medien wie den NDR, der das völlig unkritisch wiedergibt. Und wo ich schon beim Ärgern bin, muss ich doch mal deutlich befinden: Die Anti-Atomkraftbewegung ist die Brutstätte der zunehmenden Palinisierung (Sarah, nicht Michael) der deutschen Gesellschaft, die in der Bagatellisierung des Guttenberg-Betrugs einen neuen Höhepunkt gefunden hat.

*Disclaimer: Als Mitarbeiter des Forschungszentrums Jülich werde ich auch durch die Helmholtz-Gemeinschaft bezahlt, zu der auch das Helmholtz-Zentrum München gehört.


SCHERB, H., & VOIGT, K. (2007). Trends in the human sex odds at birth in Europe and the Chernobyl Nuclear Power Plant accident Reproductive Toxicology, 23 (4), 593-599 DOI: 10.1016/j.reprotox.2007.03.008



Flattr this

Kommentare (106)

  1. #1 Jörg
    05/22/2012

    Hagen Scherb: Es reicht. Jeder kommentiert hier wie er möchte, abgesehen davon dass der Kommentar pseudonym und nicht anonym ist, sind ethische Unterstellungen aufgrund des Namen ekliges Privileg-Heraushängenlassen und absolut unerwünscht. Das ist ist mein Blog, und hier gelten meine Regeln.
    Und jetzt ziehen Sie sich mal mit Herrn Kusmierz ins Kämmerlein zurück, nehmen ein Klasse 10 Physikbuch oder einen Einsteigertext Statistik und lesen das mit Fehleranalyse und Signifikanz und wie man Modelle baut und wie man daraus schlussfolgert alles mal nach, die Defizite sind einfach zu eklatant. Das sowas unter dem Namen der Helmholtz-Gemeinschaft verbreitet werden darf, ist schon ein Schlag in die Magengrube jedes redlichen Wissenschaftler/jeder redlichen Wissenschaftlerin.

  2. #2 Hagen Scherb
    05/22/2012

    Hallo Herr Rings,

    ich hatte darauf hingewiesen, dass wir einem „Maxim“ keine Papers schicken können. Wissenschaftliche Kommunikation läuft normalerweise nicht anonym/pseudonym.

    Ich verstehe, dass Ihre Nerven blank liegen. Aber Sie haben das hier nun mal selbst angezettelt. Oben hatten Sie für einen Moment lang die richtige Ahnung: Dass Sie sich nämlich zum „Statistik-Vollhorst“ gemacht haben (Jörg• 28.02.11 • 21:56 Uhr).

    Wenn Sie ein wenig Einblick in Begriffe wie Binomialverteilung, statistische Unabhängigkeit, Varianz, Signifikanz, logistische Regression, Mathematisch/Statistische Modellierung, Interaktion usw. hätten, dann würden Sie vielleicht erkennen worum es hier geht. Offenbar können Sie mit unseren Publikationen nicht viel anfangen.

    Ihre Voreingenommenheit ist für Jeden offensichtlich: Unsere Pilotarbeit von 2007 haben Sie dankenswerterweise aufgegriffen, aber nicht mehr die Folge- und Parallelarbeiten, die unsere Pilotarbeit von 2007 sehr stark stützen. Wenn Sie mir die Frage (16.05.12 • 10:31) nach dem „Warum“ Ihrer Ignoranz nicht beantworten, dann vielleicht wenigstens sich selbst?

    Viele Grüße, HS

  3. #3 Hagen Scherb
    05/22/2012

    PS: Der Witz “ist ist” nicht schlecht: “Jeder kommentiert hier wie er möchte … Das ist ist mein Blog, und hier gelten meine Regeln.”

  4. #4 Wiener
    06/05/2012

    @Hagen Scherb

    “…ich hatte darauf hingewiesen, dass wir einem „Maxim“ keine Papers schicken können. Wissenschaftliche Kommunikation läuft normalerweise nicht anonym/pseudonym.”

    Ich bleibe hier ebenfalls – aus beruflichen und privaten Gruenden – gerne bei meinem Pseudonym. Ich habe gewaltige Bauchschmerzen bei Ihrer Statistik – ohne Ihnen natuerlich die Fachkompetenz absprechen zu wollen. Da ich aber hier nicht mit Klarnamen poste, ist eine weitere Diskussion zwischen uns wohl nicht zielfuehrend. Ich waere aber an Ihrer Meinung zur Kritik dieser Kollegen interessiert:
    http://www.unstatistik.de/

  5. #5 Hagen Scherb
    06/05/2012

    Hallo Frau/Herr Wiener,

    eine Frage zurück: Worin besteht denn die faktische (!!!) “Kritik dieser Kollegen”? Ich sehe bei diesen Leuten auch eher nur eine Art “Bauchschmerz”, dass nicht sein kann, was nicht sein darf. Ansonsten verweise ich auf unsere zahlreichen Publikationen und Vorträge: Link-Adressen s.o. oder unter meiner URL. Wenn Sie präzise Fragen haben, kann ich versuchen, diese auch präzise zu beantworten. Ein Tipp von mir: Gehen Sie ruhig einmal mit dem Kopf an die Sache heran, und nicht nur mit dem Bauch. Vielleicht haben Sie dann weniger Kopfschmerzen als Bauchschmerzen?

    Viele Grüße, HS

  6. #6 Jörg
    06/09/2012

    Hier ist jetzt Schluss. Mit Fundamentalisten diskutieren ist sinnlos.