Eine Gretchenfrage bei der Beurteilung, wie gesund die Bevölkerung einer Region ist, ist die, ob sie gesünder oder kränker als die Bevölkerung einer Vergleichsregion ist. Geht es z.B. um die Bevölkerung eines Bundeslandes, interessiert oft der Vergleich mit dem Bundesdurchschnitt.

In vielen Fällen ist das kein Problem. Man hat vergleichbare Daten für das Land und für den Bundesdurchschnitt, vergleicht das, fertig. Wenn es um kleine Zahlen geht (und die Daten nicht als Vollerhebung zu betrachten sind), berechnet man vielleicht noch ein Konfidenzintervall, um sich etwas gegen Zufallseinflüsse abzusichern. Ein Beispiel: Der Todesursachenstatistik zufolge lag die Sterberate an Darmkrebs (ICD C18 – C21) im Jahr 2015 in Bayern bei 28,3 Sterbefällen je 100.000 Einwohner/innen, in Deutschland bei 31,1 Sterbefällen je 100.000 Einwohner/innen. Die Sterberate in Bayern liegt also etwas unter dem bundesdeutschen Durchschnitt. Konfidenzintervalle kann man sich in dem Fall sparen, auch wenn man nicht nur das Jahr 2015 (dann hat man eine Vollerhebung), sondern einen größeren Zeitraum betrachtet: Dann könnte man das Jahr 2015 als – mehr oder weniger zufällige – Stichprobe betrachten, eine millionenstarke Stichprobe, die auch kleine und womöglich inhaltlich belanglose Differenzen sofort statistisch signifikant macht.

Man kann jetzt auch noch danach fragen, ob der Unterschied nur darauf zurückzuführen ist, dass die Bevölkerung Deutschlands älter ist als die Bayerns und daher – Darmkrebs tritt im Alter häufiger auf – in Deutschland eine höhere Darmkrebssterberate zu erwarten sei. Dem ist nicht so. Bei der altersstandardisierten Rate kommt Deutschland auf 16,1 Fälle je 100.000 Ew., Bayern auf 15,5 – jeweils standardisiert mit der alten Europastandardbevölkerung. Falls sich jemand fragt, warum die altersstandardisierte Rate nur halb so hoch ist wie die sog. „rohe“ Sterberate: Das ist ein in diesem Zusammenhang irrelevanter Verzerrungseffekt, weil die alte Europastandardbevölkerung vergleichsweise jung ist und daher die Höhe der Raten rechnerisch verringert wird. Die Altersstandardisierung soll aber nur geeignete Vergleichsziffern liefern, das tut sie.

Manchmal ist es aber mit dem Durchschnitt nicht so einfach. In der Broschüre „Krebs in Deutschland 2011/2012“ des Robert Koch-Instituts findet sich beispielsweise diese Grafik zum Darmkrebs:

Darmkrebs_RKI

Man sieht, dass auch schon 2011/2012 die Sterberate in Bayern niedriger ist als im Bundesdurchschnitt, aber die Neuerkrankungsrate liegt sowohl bei den Männern als auch bei den Frauen darüber. Gut, das kann natürlich sein. Vielleicht wird Darmkrebs in Bayern z.B. früher erkannt und dadurch mit mehr Erfolg behandelt als im bundesdeutschen Durchschnitt, so dass mehr Neuerkrankungen und weniger Sterbefälle durchaus kein Widerspruch sein müssen.

Was allerdings irritiert ist, dass eine Tabellenabfrage auf der Seite der Gemeinschaft der Epidemiologischen Krebsregister in Deutschland (GEKID) für die Jahre 2011 und 2012 ein anderes Ergebnis liefert, nämlich niedrigere Neuerkrankungsraten als im Bundesdurchschnitt. Die Berechnung der Raten für Bayern ist identisch mit der in der RKI-Broschüre, es sind jeweils an der alten Europabevölkerung standardisierte Raten für die ICD-Ziffern C18 – C21:

Darmkrebs_GEKID

Wie kann das sein? Der springende Punkt dabei ist, dass die Rate für Deutschland bei den Krebsneuerkrankungen nicht einfach „zusammengezählt“ werden kann. Die Meldungen an die Krebsregister in den Bundesländern sind unterschiedlich vollzählig und man kann ihre Daten daher nicht ohne Weiteres aufaddieren. Die Rate für Deutschland beruht auf einem Hochrechnungsverfahren und die Methodik bei GEKID ist nicht ganz identisch mit der Methodik in der RKI-Broschüre, mit dem Ergebnis, dass der Deutschlandwert bei GEKID etwas höher (und über dem bayerischen Wert) liegt, beim RKI etwas niedriger (und unter dem bayerischen Wert). Die wahre Differenz zwischen Bayern und Deutschland ist nicht so ausgeprägt, dass sie sich gegenüber dem Methodeneinfluss durchsetzt. Beim Prostatakrebs sieht es übrigens ähnlich aus.

Hat nun Bayern eine höhere oder eine niedrigere Darmkrebsrate als Deutschland insgesamt? Sicher sein kann man nicht. Die bayerische Rate liegt nicht weit vom Durchschnitt, so viel steht fest. Die GEKID-Daten haben einen etwas späteren Meldestand, sind daher etwas vollständiger und das RKI-Hochrechnungsverfahren macht (wie mir gesagt wurde) Annahmen, die im Vergleich Bayern-Deutschland problematisch sein könnten, so dass mit Blick auf diesen Vergleich die GEKID-Daten die wahren Verhältnisse wohl eher abbilden. Aber wer weiß.

Dass die Reihenfolge von Regionen bei Krankheits- oder Sterberaten manchmal durch die methodische Vorgehensweise bei der Berechnung der Kennziffern beeinflusst sein kann, ist letztlich trivial und auch in vielen anderen Zusammenhängen zu beachten. Man muss halt wissen, wann. Nicht immer zeigen sich die wahren Sachverhalte in epidemiologischen Kennziffern so objektiv, wie man sich das wünschen würde.

———————
Disclaimer: Von gedankenlosen Sprüchen der Art, „ich glaube nur der Statistik, die ich selbst gefälscht habe“, bitte ich in den Kommentaren Abstand zu nehmen.

Kommentare (8)

  1. #1 Umami
    20. August 2017

    Irgendwo bei der altersstandardisierten Rate bin ich abgehängt worden…..

    • #2 Joseph Kuhn
      20. August 2017

      @ Umami:

      “Irgendwo bei der altersstandardisierten Rate bin ich abgehängt worden…..”

      Sorry. Ich habe versucht, es so einfach wie möglich zu machen. Das mit der Altersstandardisierung kann man aber problemlos überlesen, es ist eine Arabeske der Geschichte, die nichts zur Sache tut.

  2. #3 Umami
    20. August 2017

    Soll dies vielleicht bedeuten, dass man die Sterblichkeit nicht auf die tatsächliche Bevölkerung betrachtet, sondern auf eine “Musterbevölkerung”, die halt eine andere Altersverteilung hat?
    Man tut so, als wären die Bayern nicht 50plus (ich sehe das als Verteilungskurve vor mir), sondern grundsätzlich jünger, somit muss man auch die Sterblichkeiten anpassen. Das tut man, damit die Daten vergleichbar sind.
    Krebsraten von Altersheimen und Kindergärten sind sonst nicht vergleichbar.
    So etwas?

    Mit Lücken zu lesen, find ich etwas schwierig.

    Ist also die Essenz: Daten vergleichen ist schwierig, wenn man schon Probleme hat, über gleiche Zeiträume vergleichbare Daten zu erhalten?

    • #4 Joseph Kuhn
      20. August 2017

      @ Umami:

      “Soll dies vielleicht bedeuten …”

      Ja, bei der direkten Altersstandardisierung, die hier verwendet wurde, bezieht man die Sterblichkeit auf eine Musterbevölkerung. Die muss nicht jünger sein als die reale, aber es muss für alle Gruppen, die man vergleichen will, die gleiche sein. Die alte Europastandardbevölkerung ist zufällig jünger als die deutsche oder die bayerische, weil sie jahrzehnte alt ist und die damals jüngere europäische Bevölkerung abbildet. Man könnte aber genauso gut eine andere Bevölkerung als Muster nehmen. Die Krebsregister verwenden einheitlich die alte Europastandardbevölkerung, damit man nicht immer für jeden Vergleich alles wieder neu rechnen muss.

      “Ist also die Essenz: Daten vergleichen ist schwierig, wenn man schon Probleme hat, über gleiche Zeiträume vergleichbare Daten zu erhalten?”

      Das ist zwar oft richtig, aber in dem Fall geht es um etwas anderes. Die Krebszahlen, die man verwendet, sind im Prinzip die gleichen (wie gesagt, der Meldestand ist nicht gleich): Es sind die an die Krebsregister gemeldeten Fälle. Die Bevölkerungszahlen für die Ratenbildung sind auch gleich, das Altersstandardisierungsverfahren ebenfalls. Aber RKI und GEKID berechnen den Durchschnittswert für Deutschland etwas unterschiedlich, das bringt Bayern einmal über, einmal unter den Durchschnitt.

  3. #5 Umami
    22. August 2017

    Wie berechnen sie denn den Durchschnittswert jeweils?

    • #6 Joseph Kuhn
      22. August 2017

      “Wie berechnen sie denn den Durchschnittswert jeweils?”

      Auf komplizierte Weise. Die methodischen Hinweise zu beiden Verfahren sind im Blog verlinkt, siehe den Absatz direkt unter der Tabelle. Die Verfahren im Detail zu erklären, vor allem das des RKI, übersteigt meine Kenntnisse.

  4. #7 Beobachter
    23. August 2017

    Da es nicht um Krebs geht –
    etwas off topic, aber offenbar auch ein “statistisches Problem”:

    Heute in der SZ:
    http://www.sueddeutsche.de/politik/rechtsextremismus-tote-die-nicht-zaehlen-1.3634762

    Da es m. E. durchaus Parallelen gibt, fällt mir dazu immer der Mathematiker und Statistiker E. J. Gumbel ein:

    http://www.zeit.de/2012/07/Gumbel

    Artikel-Überschrift:

    “Emil Julius Gumbel

    Das rechte Auge
    Im Kampf gegen den Terror von rechts haben die deutschen Strafverfolger schon einmal versagt. Der Mann, der ihnen das Zahl für Zahl nachwies, hieß Emil Julius Gumbel. Deutschland hat es ihm nicht gedankt.”

  5. […] Über oder unter dem Durchschnitt? Gesundheits-Check am 19. August […]