In den letzten Tagen sorgte ein Studie aus Japan für Nachrichten. “Elevated Thyroid Cancer Incidence Seen in Children Near Fukushima Nuclear Plant” Sie besagt, dass bei Kindern der Provinz Fukushima nach 2011 mehr Krebsfälle diagnostiziert wurden als zuvor. Das ist unbestreitbar, die Diagnosen und die darauf folgenden Behandlungen hat es gegeben.
Ich habe zu diesem Thema bisher mit Absicht nichts geschrieben. Ich bin kein Mediziner und die Ergebnisse wirkten suspekt. Beides zusammen ist ein Warnsignal dafür, dass man Schnellschüsse besser unterlassen sollte. Nach näherer Beschäftigung mit dem Thema habe ich mich nun doch entschlossen, einen Artikel darüber zu schreiben. Der erste Teil über die veröffentlichte Studie selbst und der zweite Teil über eine Auswertung von Details dieser Studie durch andere Wissenschaftler.
Die Diagnosen wurden im Rahmen der Ultraschalluntersuchung von fast 300.000 Schilddrüsen gestellt. Davon wurden 2067 positive Fälle durch weitere Untersuchungen mit “fine needle aspiration cytology (FNAC)” untersucht und 110 Fälle als Krebs diagnostiziert. 87 davon wurden operiert und 86 stellten sich den Untersuchungen zufolge als Krebs heraus.
Über die Zuverlässigkeit der FNAC gibt es wissenschaftliche Untersuchungen. Zitat:
FNAC is inexpensive, widely available and easy to perform, and is therefore regarded as a part of the initial investigation for a thyroid nodule. Acute complications are rare and there is no reported case of cutaneous implantation of malignant cells following FNAC of thyroid nodule [18]. It has a pre-operative predictive accuracy of more than 90% [18] and aids the surgeon in selecting the most appropriate procedure prior to surgery. It has reduced the cost of work-up compared with either ultrasound or scintigraphy [9]. However, the utility of FNAC depends on the skill of the person performing the procedure and on the experience of the cytopathologists [18]. FNAC has an overall false negative rate of between 0.5% and 11.8% (pooled rate of 2.4%) and a false positive rate of 0%–7.1% (pooled rate of 1.2%) [9, 24]. The false negative rates can be reduced by better sampling techniques, meticulous follow-up and serial FNAC examinations [18].
Die Zuverlässigkeit der Methode hängt von den allgemeinen Fähigkeiten (“skill”) und der Erfahrung des Untersuchenden ab. Die Rate der falsch-positiven Diagnosen läge damit je nach diesen Umständen zwischen 0 und 7%. Wenn Mediziner 2000 gesunde Schilddrüsen mit FNAC untersuchen, dann muss man nach diesen Ergebnissen bis zu 142 falsch diagnostizierte Krebsfälle gesunder Patienten erwarten. Man sollte anmerken, dass für Reihenunterschungen von hunderttausenden Patienten wahrscheinlich weder ausgesucht gute und erfahrenen Mediziner zur Verfügung standen, noch wenigstens durchschnittlich gute. Das ist kein Vorwurf an die Mediziner, sondern eine schlichte Beschreibung der Situation in Anbetracht der Größe der untersuchten Bevölkerung.
Trotzdem geben die Autoren zu Protokoll:
“The investigators noted that the approximately 30-fold overall increase in thyroid cancer incidence might be the result of a screening effect, meaning there could be silent thyroid cancer cases among children in the unscreened parts of Japan. They conclude, however, that the magnitude of the IRRs is too large to be explained by such an effect.”
Man habe herausgefunden, dass ein Screening Effekt das Ergebnis nicht erklären könne. Aber hier hat man, die Möglichkeit falsch-positiver Diagnosen aus dem Begriff “screening effect” herausdefiniert hat.
Jeder Schüler oder Student lernt eine Beschreibung dieses Effekts in jeder Einführung zur Statistik kennen, noch dazu genau in dieser Konstellation. Man untersucht eine große Gruppe von Menschen mit einer seltenen Krankheit, mit Hilfe eines Tests in einer gewissen Zahl der Fälle auch bei gesunden Menschen eine Krankheit angibt. Es ist das, was man im englischen ein sprichwörtliches “textbook example” nennt. Den Autoren kann diese Tatsache also auf gar keinen Fall entgangen sein. Trotzdem wird die Möglichkeit falsch-positiver Diagnosen im gesamten Bericht nicht erwähnt oder gar auf Häufigkeit untersucht.
Ich bin kein Mediziner. Es ist gut möglich, dass ich hier einem Fehler aufsitze und die falsch-positiven Resultate doch keine Rolle spielen. In dem Fall ist das Fehlen jeder Fehlerbetrachtung dennoch auffällig und es ist nicht die einzige Auffälligkeit.
Vergleich mit Tschernobyl
Eine weitere Auswertung der Daten von anderen Wissenschaftlern brachte folgende Ergebnisse:
Compared to rates before the Fukushima power plant disaster, average tumor size was significantly smaller (4.1 cm vs 1.4 cm) for children and adolescents, and the male-to-female patient ratio was lower (1:4.3 vs 1:1.8), Dr. Suzuki noted. Thyroid cancer patients’ average age at surgery was also older among the post–Fukushima disaster patients (age 17.4 years vs 11.9 years).
Die eigentliche Bedeutung dieser Zahlen wird in dem Artikel nicht genannt. Bei der ersten Zahl ist die Implikation noch recht offensichtlich. Vor 2011 waren die Tumore, die bei Kindern und Jugendlichen operiert wurden typischerweise 4,1 cm groß. Nach 2011 waren sie nur noch 1,4cm groß. Das heißt, dass sie früher etwa 25 mal so schwer waren. (Sie sind ja nicht nur knapp 3 mal so lang, sondern auch 3mal so breit und 3mal so hoch.)
Gleichzeitig hatten die Patienten zur Zeit der Operation ein viel höheres Alter. Anstatt knapp 12 Jahre alter Kinder, waren die typischen Patienten im OP im Schnitt 17,4 Jahre alte, fast ausgewachsene Jugendliche. Man fand also viel kleinere Tumore, in wesentlich größeren Körpern.
Warum Dr. Suzuki diese Zahlen zusammen nennt, ist mir aber erst klar geworden, als ich irgendwann nach dem Geschlechterverhältnis suchte. Wie gesagt. Ich bin kein Mediziner und ich war mir der Bedeutung dieser Zahlen nicht bewusst und habe sie erstmal ignoriert. Aber schließlich hat jeder Mensch, egal ob Mann oder Frau, eine Schilddrüse. Wieso sind die Verhältnisse also unterschiedlich und was bedeutet es, dass sie sich angeglichen haben?
Die Antwort findet sich hier im International Journal of Epidemiology in einer Studie aus dem Jahr 2004.
Results Age-adjusted thyroid cancer incidence rates (adjusted to the WHO 2000 world population) have increased between 1970 and 2001 from 0.4 per 100 000 to 3.5 per 100 000 among males (+775%) and from 0.8 per 100 000 to 16.2 per 100 000 among females (+1925%). The relative increase among males (+1020%) and females (+3286%) in ‘high exposure’ areas exceeded increases among males (+571%) and females (+250%) in ‘lower exposure’ areas of Belarus. Dramatic increases in thyroid cancer incidence rate ratios were noted among both males and females and in all age groups. The highest incidence rate ratios were observed among people from ‘higher exposure’ areas ages 0–14 yr at time of diagnosis.
Die Zahl der Fälle von Schilddrüsenkrebs stieg nach dem Unfall von Tschernobyl bei Mädchen noch viel stärker als bei Jungen. Die Verhältnisse strebten also noch weiter auseinander. In Fukushima hingegen gleichen sie sich an. Es ist also der genau das Gegenteil des Effekts, den man von radioaktivem Iod erwarten würde. Das gleiche Berichten auch andere Studien, ebenso wie von einer besonderen Anfälligkeit sehr junger Kinder. Aber auch hier stellt man in Fukushima das genaue Gegenteil fest. Das Durchschnittsalter der betroffenen Kinder hätte drei Jahre nach dem Unfall sinken müssen (die Daten stammen von 2014), aber stattdessen stieg es um über 5 Jahre.
Dazu kommt noch das Fehlen eines statistisch signifikanten Zusammenhangs zwischen der Zahl der Krebsfälle und der Strahlenexposition in der Provinz Fukushima. Und damit meine ich tatsächliche statistische Signifikanz und keine Ausreden, wie man sie von Wissenschaftlern zu hunderten kennt.
In Anbetracht solcher Widersprüche sollte man sich die ernsthafte Frage stellen, ob dort wirklich krankhafte Tumore operiert werden. Viele Fehler braucht es dafür nicht. Selbst die nun 30-fach erhöhte Zahl von Schilddrüsenkrebsdiagnosen läuft auf eine Häufigkeit von etwa einem Fall von 2000 Menschen hinaus. (Wobei das 95% Konfidenzintervall wegen der geringen Fallzahlen zwischen 1 von 1000 und 1 von 3000 liegt.) Der Unterschied ist nur, dass hunderttausende Menschen untersucht werden. Aus der Zahl der Todesfälle nach der Behandlung wird man bei Schilddrüsenkrebs übrigens auch kaum Schlüsse ziehen können. Bei dieser Krebsart liegt die Zahl der Todesfälle unter 1%, wenn sich der Tumor nicht ausgebreitet hat. Eine notwendige Behandlung unterscheidet sich im Ergebnis also kaum nachweisbar von einer überflüssigen Behandlung, gerade weil sie im Ernstfall so erfolgreich sind.
Trotz all dieser Schwierigkeiten ist nichts von doppelblind Untersuchungen der Gewebeproben oder ähnlichen Methoden zu lesen, um die Zuverlässigkeit der Diagnosen zu überprüfen. Dabei es ist durchaus zu vermuten, dass Ärzte bei Patienten aus der Provinz Fukushima oder Schilddrüsenuntersuchungen allgemein nicht mehr unvoreingenommen sind. Nicht umsonst weißt Dr Nagataki auch auf diesen Umstand hin:
“In Japan, mental and social effects of the disaster are major health problems, compared with health effects from radiation,” Dr. Nagataki said. “Social well-being, depression—and anger at the electrical utilities and government, and requests for compensation—are big, big social problems.”
Es waren gerade solche Umständen, wenn die Objektivität der beteiligten Personen aus offensichtlichen und unvermeidlichen Gründen eingeschränkt ist, die zur Entwicklung der wissenschaftlichen Methoden führten. Aber die wissenschaftliche Methode funktionieren nicht aufgrund der Tatsache, dass man in einer wissenschaftlichen Gesellschaft lebt oder einem wissenschaftlich begründeten Beruf arbeitet. Man muss sie aber auch anwenden.
Kommentare (46)