Wie heißt es so schön: ein Bild sagt mehr als 1.000 Worte. Manchmal braucht man in der Tat einige Worte, um Bilder zu erklären, vor allem, wenn Bilder nicht dasselbe zeigen, obwohl sie es tun sollten, oder wenn ein Bild nicht klar spricht.
Seit längerem habe ich keine Grafiken mehr zur Übersterblichkeit aus den Daten des Statistischen Bundesamtes erstellt. Hier ist wieder eine. Sie beruht auf der Sonderauswertung der Statistischen Bundesamtes vom 11.12.2020 und zeigt wie ihre Vorläufer hier im Blog die prozentuale Übersterblichkeit 2020 gegenüber dem Durchschnitt 2016-2019 nach Kalenderwochen. Der Auswertezeitraum des Statistischen Bundesamtes reicht aktuell bis Mitte November.
Was sieht man: Wie schon in den anderen Grafiken zur Übersterblichkeit hier im Blog sieht man zu Beginn des Jahres 2020 eine Untersterblichkeit. Das ist auf die vielen Influenza-Sterbefälle 2016/2017 und vor allem 2017/2018 zurückzuführen. Im März gab es in Deutschland die ersten Coronatoten. Auf dem Höhepunkt der Epidemie im April zeigt sich eine deutliche Übersterblichkeit. Man sieht dann den Rückgang der Übersterblichkeit und im Sommer einen scharfen Zacken: eine kurze, aber ausgeprägte hitzebedingte Übersterblichkeit.
Wie sich die vielen Coronatoten seit Mitte November in solchen einfachen Übersterblichkeitsberechnungen niederschlagen, bleibt abzuwarten. Möglicherweise gleichen sich die Coronatoten mit den Influenzatoten der Vorjahre teilweise aus.
Die gleichen Daten hat Harald Walach in einem neuen Blogbeitrag in eine Grafik umgesetzt. Er bildet die absoluten Fallzahlen ab, aber das ist hier nicht weiter von Belang. Sein Rechenweg:
„Dann habe ich die Daten der Jahre 2016-2019 zusammengefasst und je Woche gemittelt. Ich habe die Standardabweichung dieser vier Jahre verwendet und den Standardfehler des Mittelwertes je Woche berechnet, mit 1.96 multipliziert und zum Mittelwert addiert. Die blaue Kurve gibt also die Obergrenze dessen wieder, oberhalb dessen eine Abweichung 2020 signifikant (um die klassische 5%ige Signifikanzgrenze) von den Mittelwerten der Jahre zuvor je Woche abweicht. Damit die Kurve etwas leichter optisch interpretierbar ist, habe ich außerdem geglättet, indem je 5 Wochen zusammengefasst sind; die Fehlerbalken geben die Variabilität innerhalb dieser Zeit an.“
Das Ergebnis sieht so aus:
Die blaue Kurve verläuft zu Jahresbeginn weit über der roten, danach verlaufen die Kurven mehr oder weniger ähnlich. Walachs Fazit: „Es gibt keine außergewöhnliche Mortalität in Deutschland.“
Es lohnt, sich seine Aufbereitung der Daten einmal näher anzusehen. Auffällig ist, dass er immer 5 Wochen zusammenfasst. Dadurch werden kurze Phasen der Übersterblichkeit zum Verschwinden gebracht, sie gehen in einer solchen Durchschnittsbildung unter. Wenn einer 10.000 Euro im Monat verdient und einer 1.000 Euro, haben sie im Schnitt 5.500 Euro, keiner ist arm.
Des Weiteren ist die blaue Kurve nicht einfach der Durchschnitt der absoluten Fallzahlen 2016-2019, sondern die Summe daraus mit dem halben Konfidenzintervall. Er will damit zeigen, dass die Sterbefälle 2020 (die rote Linie) kaum über dem Durchschnitt 2016-2019 lagen – statistisch signifikant auf dem 95 %-Niveau. Eine solche Signifikanzbetrachtung interpretiert die Sterbefälle als Zufallsstichprobe aus einer hinreichend großen Grundgesamtheit. Aber aus welcher Grundgesamtheit? Einem fiktiven Sterbefall-Pool aus 30 Jahren? Und sind die Jahre 2016-2020 wirklich als Zufallsstichproben aus einem solchen Pool zu interpretieren? Oder als systematisch verzerrte Stichproben?
Die blaue Kurve hat Walach zudem gebildet, indem er zum Mittelwert der Sterbefälle 2016-2019 den Faktor 1,96 mal Standardfehler des Mittelwerts addiert hat. Das „1,96“ zeigt eine Normalverteilungsschwelle an. Den Standardfehler hat er aus den vier Datenpunkten 2016, 2017, 2018 und 2019 für jede Woche berechnet. Aber was ist daran normalverteilt? Ich meine, es wäre einfacher und klarer gewesen, die Sterbefälle als das zu behandeln, was sie sind: Eine Totalerhebung der Jahre 2016 – 2020. Keine Stichprobe, kein Konfidenzintervall.
Was ich zudem nicht verstehe, sind die Fehlerbalken. Die Balken seien die „Schwankungsbreite“, sagt er. Sind das bei der blauen Kurve Minimum und Maximum der vier Jahre? Wenn ja, warum sind die Balken dann an der blauen Kurve angelegt, die nicht den Mittelwert der Jahre 2016-2019 abbildet? Und wo kommen die Balken für 2020 her? Oder sind das jeweils Minimum und Maximum in den dargestellten 5-Wochenzeiträumen? Oder noch etwas anderes? Man darf raten. Sie auch.
————
Edit 16.12.2020: Ein Satz präzisiert, siehe Kommentar #5.
Kommentare (42)