Kellner und Lungenkrebs
In den letzten Jahren ist immer wieder das Gesundheitsrisiko von Kellnern infolge ihrer beruflichen Tabakrauchbelastung diskutiert worden. Eine Reihe von Studien hat gezeigt, dass Kellner ein erhöhtes Lungenkrebsrisiko haben, z.B. die NOCCA-Studie, der Daten von 15 Mio. Menschen zugrunde liegen. Besonders verwunderlich ist das nicht, schließlich rauchen in diesem Beruf viele Beschäftigte und die Passivrauchbelastung war zumindest in der Vergangenheit auch nicht unerheblich. Romano Grieshaber, Honorarprofessor für Angewandte Prävention und Gesundheitsförderung an der Universität Jena, sieht die Dinge anders. Er behauptet, er hätte gezeigt, dass Kellner sogar ein geringeres Lungenkrebsrisiko hätten als die Allgemeinbevölkerung.
Vor ein paar Tagen hatte ich im Blogbeitrag zu Beda Stadler bereits kurz die gewagte Krebsepidemiologie Grieshabers kommentiert (siehe dort meinen Kommentar vom 23.9.).
Da Grieshaber immer wieder auf diese Daten zu sprechen kommt, sollen sie doch einmal etwas ausführlicher vorgestellt werden. Dieser Blogbeitrag ist daher ein gutes Stück länger geworden als üblich, aber am Ende ist man dafür auch ein gutes Stück klüger.
Grieshabers Daten …
Ich habe keine Publikation gefunden, in denen Grieshaber seine Daten systematisch vorstellt, daher beziehe ich mich im Folgenden auf die entsprechenden Passagen in seinem Buch „Passivrauchen“. Dort schreibt er auf Seite 37:
“Unsere Ergebnisse sind von verschiedener Seite angezweifelt worden, deshalb an dieser Stelle Genaueres über die Daten, die wir, wie erwähnt, einem übergeordneten Forschungsprojekt entnommen hatten.“
Eine Seite weiter präsentiert er dann die Daten, die seinem Befund mit den niedrigeren Lungenkrebsraten bei Kellnern zugrunde liegen:
Bei den männlichen Kellnern steht also eine Rate von 1,08 pro 10.000 Versicherten einer Rate von 2,47 pro 10.000 Einwohnern gegenüber, bei den weiblichen Kellnern eine Rate von 0,61 pro 10.000 Versicherten einer Rate von 1,15 pro 10.000 Einwohnerinnen. Ergo, so Grieshaber, ist das Lungenkrebsrisiko der Kellner niedriger als in der Allgemeinbevölkerung.
… und was davon zu halten ist
Schaut man sich die Daten an, springt sofort die kleine Zahl von Lungenkrebsfällen ins Auge, auf denen die Ratenberechnung für die Kellner beruht. Bei den Männern waren es 3 Fälle in 7 Jahren, bei den Frauen 4 Fälle in sieben Jahren. Wer auf solcher Datenbasis so weitreichende Folgerungen ziehen will wie Grieshaber, muss sehr sorgfältig vorgehen, aber bei Grieshabers Umgang mit diesen Daten kann man nur den Kopf schütteln.
Wenn man eine so große erwartungswidrige Ratendifferenz hat, stellt sich vor allem die Frage nach der Zuverlässigkeit der Daten. Immerhin, ein Problem spricht auch Grieshaber auf Seite 40 seines Buches in diesem Zusammenhang an: dass die meisten Lungenkrebsfälle erst im Rentenalter auftreten, er also keine Aussage zum Lebenszeitrisiko der Kellner machen könne. Das ist richtig und damit wird natürlich ein ganz wichtiger Aspekt des Themas einfach ausgeklammert. Wenn die Kellner aus irgendwelchen Gründen tatsächlich während ihres Berufslebens ein geringeres Lungenkrebsrisiko hätten (was sie nicht haben), aber anschließend viel häufiger als die Allgemeinbevölkerung an Lungenkrebs erkranken und Jahre früher sterben würden, so wäre das ja alles andere als eine Entwarnung, was die Risiken ihres Berufs angeht. Das ist Epidemiologie nach dem Motto „aus den Augen, aus dem Sinn“.
Grieshaber zieht auf der gleichen Seite seines Buches folgendes Fazit:
„Eine Aussage, was das Lebenszeitrisiko der untersuchten Berufsgruppen betrifft, konnte durch die Daten der BGN also nicht getroffen werden. Aber bis zum Alter von 59 Jahren lässt sich mit ausreichender Sicherheit feststellen, dass das Berufszeitrisiko der Kellner, an Lungenkrebs zu erkranken, (…) niedriger liegt als das Risiko der Wohnbevölkerung desselben Alters (…).“
„Mit ausreichender Sicherheit“ also. Diese Zuverlässigkeit liefern seine Daten aber nicht:
1. Bei diesen kleinen Fallzahlen darf kein Fall übersehen werden, weil das darauf gestützte Rechenwerk extrem empfindlich auf fehlende Fälle reagiert. Ich komme darauf weiter unten noch einmal zurück. Dass die Arbeitsunfähigkeitsdaten ein so hohes Maß an Zuverlässigkeit bieten, das jedenfalls kann „mit ausreichender Sicherheit“ ausgeschlossen werden. Beispielsweise werden nebenberuflich tätige Kellner bei den Krankenkassen nicht als Kellner geführt, ihre Fallzahlen fehlen. Weiterhin sind nicht alle Kellner sozialversicherungspflichtig beschäftigt, auch die Erkrankungsfälle dieser Gruppe fehlen. Des Weiteren sind die Berufsangaben in den Stammdaten der Krankenkassen nicht immer aktuell. Fälle gehen vermutlich auch durch einen healthy worker effect verloren, darauf deutet die Altersverteilung der Versicherten hin (siehe dazu auch Punkt 6). Ebenso ist die Validität der Arbeitsunfähigkeitsdiagnosen begrenzt. Es kann z.B. vorkommen, dass bei der Krankschreibung die Krebserkrankung nicht als die Arbeitsunfähigkeit begründende Diagnose dokumentiert wird bzw. dass die Lungenkrebsdiagnose nur als Nebendiagnose dokumentiert wird. Ob Nebendiagnosen überhaupt durchgesehen wurden, kann man Grieshabers Darstellung nicht entnehmen. Man hätte eine Datenvalidierung vornehmen können, wenn man nicht nur die Arbeitsunfähigkeitsdaten herangezogen hätte, sondern auch Abrechnungsdaten über durchgeführte Behandlungen. Das ist offensichtlich nicht geschehen.
2. Für einen Vergleich zwischen den Versicherten und der Allgemeinbevölkerung im Verlauf eines Kalenderjahrs sollte sichergestellt sein, dass nicht nur die Allgemeinbevölkerung ein Jahr unter Beobachtung war, sondern auch die Kellner. Kellner arbeiten vergleichsweise häufig saisonal. Das kann, wie auch der Fall eines Krankenkassenwechsels im Beobachtungsjahr, von den Krankenkassen durch die Berechnung von „Versichertenjahren“ korrigiert werden. Man gleicht dazu die Versichertentage mit den Kalendertagen ab. Bei Kellnern ist anzunehmen, dass es weniger Versichertenjahre (ganzjährig Versicherte) als Versicherte gibt. Berechnet man die Lungenkrebsrate der Kellner anhand von Versichertenjahren, steigt sie also.
3. Die regionalen Einzugsbereiche der Krebsregisterdaten und der Krankenkassendaten sind nicht identisch. Das Lungenkrebsrisiko der Allgemeinbevölkerung ist aber regional unterschiedlich. Nimmt man die Lungenkrebssterblichkeit als Indikator, so liegt sie in Nordrhein-Westfalen (hier kommt ein Teil der Krankenkassendaten her) höher als in Ostdeutschland, also dem Einzugsgebiet der Registerdaten. Anhand der vorliegenden Daten kann ich nicht abschätzen, wie relevant das in diesem Fall ist, aber wer so weitreichende Aussagen wie Grieshaber trifft, muss das abklären.
4. Grieshaber gibt keine Begründung dafür an, warum er in der Tabelle mit den Krebsregisterdaten von den gemeldeten Fällen in allen Altersklassen mit dem gleichen Erfassungsgrad der Meldungen auf Gesamtzahlen hochrechnet, die dann zur Ratenberechnung verwendet werden. Krebserkrankungen werden – so z.B. die Erfahrungen des Bayerischen Krebsregisters – in den Altersgruppen bis 50 praktisch vollständig erfasst, hier dürfte man also gar nicht hochrechnen, weil sonst die Fallzahlen überschätzt werden. Erst in den höheren Altersgruppen fehlen Meldungen vor allem von Fällen, die wegen der Schwere der Erkrankung nicht mehr therapiert werden. Ein eigenes Kapitel wäre übrigens die Berechnung des Erfassungsgrads, der ja keine einfache empirische Größe ist.
5. Unklar ist, warum Grieshaber bei seinem Ratenvergleich die gesamte Altersspanne einbezieht. Wenn es um Lungenkrebs im Zusammenhang mit der beruflichen Exposition gegenüber Tabakrauch geht, könnte man sich unter Berücksichtigung der langen Latenzzeit bis zur Entstehung eines Lungenkrebses auf die letzte Altersgruppe beschränken. Da wäre seinen eigenen Daten zufolge die Rate bei den männlichen Kellnern höher als in der Allgemeinbevölkerung.
6. Ein schwerwiegendes Problem zeigt sich beim Altersaufbau der Versichertenpopulation. Ab der Altersgruppe 20-29 ist jede höhere Altersgruppe schwächer besetzt als die vorherige. Bei den Kellnern gibt es also massive Abgänge aus dem Beruf. Dass dies keinen Einfluss auf die Lungenkrebsraten hat, d.h. dass die Abgänge unabhängig vom Lungenkrebsrisiko sind, kann nicht einfach unterstellt werden. Möglicherweise bleiben nur die gesünderen Kellner im Beruf und es wird hier ein massiver healthy worker effect ignoriert.
7. Ein weiteres gravierendes Versäumnis im Umgang mit den Altersgruppen besteht darin, dass Grieshaber einfach rohe Raten vergleicht, d.h. Raten ohne Altersstandardisierung. Man muss aber sicherstellen, dass der Ratenunterschied nicht nur durch den unterschiedlichen Altersaufbau der Vergleichspopulationen zustande kommt. Aufgrund der kleinen Fallzahlen bei den Kellnern ist die Berechnung von „Standardisierten Inzidenz-Ratios (SIR)“ ein Weg, dies zu korrigieren. Dabei berechnet man, wie viele Erkrankungsfälle in der Versichertenpopulation zu erwarten wären, wenn die gleichen altersspezifischen Erkrankungsraten wie in der Registerbevölkerung gelten würden und vergleicht das mit den tatsächlich beobachteten Werten. Liegt die SIR über 1, ist von einem erhöhten Risiko der Versichertenpopulation auszugehen, liegt sie unter 1, von einem niedrigeren Risiko. Macht man das, erhält man für die männlichen Kellner eine SIR von 0,70, bei den weiblichen eine SIR von 0,96. Mit anderen Worten: Die Rate bei den Kellnern ist altersstandardisiert zwar immer noch niedriger als in der Allgemeinbevölkerung, aber bei weitem nicht mehr so stark wie bei den rohen Raten und bei den Frauen gibt es praktisch keinen Unterschied mehr. Ein Teil des Risiko-Unterschieds, den Grieshaber präsentiert, ist also schlicht ein Altersunterschied der verglichenen Populationen.
8. Hier lohnt es sich nun auch, einmal einen kleinen Sensitivitätstest zu machen, d.h. zu schauen, was passiert, wenn bei den Kellnern ein paar Fälle mehr zu verzeichnen wären, z.B. weil sie sich nicht in den Krankschreibungen niederschlagen, wie unter Punkt 1 beschrieben. Bei den Männern reichen schon 2 Fälle mehr, damit die SIR auf 1,16 springt, bei den Frauen sogar schon 1 Fall mehr für eine SIR von 1,21. Das ist nicht weiter verwunderlich, relativ zu einer Basis von 4 wiegt ein weiterer Fall eben mehr als relativ zu einer Basis von 588. Mit anderen Worten: Bei diesen kleinen Fallzahlen verbietet sich ein Ratenvergleich mit Grieshabers Schlussfolgerungen, wenn man nicht mit absoluter Sicherheit ausschließen kann, auch nur einen einzigen Fall übersehen zu haben.
9. Das ganz kleine 1×1 der Epidemiologie hat Grieshaber auch noch in einem anderen Punkt nicht beachtet. Seine „Stichproben“, wenn man hier von Stichproben sprechen will, sind zwar recht groß: Bei den Registerdaten sind es 12 Mio. Menschen, bei den Krankenkassendaten zu den Kellnern fast 100.000 Versicherte. Richtige Zufallsstichproben sind es allerdings nicht, beides sind gegenüber einer wie auch immer zu definierenden Grundgesamtheit verzerrte Stichproben, z.B. infolge der regionalen Einschränkungen bzw. der Kassenauswahl. Aber lassen wir das einmal dahingestellt. Bei so großen Stichproben sind normalerweise fast alle Unterschiede statistisch signifikant. Berechnet man aber für Grieshabers kleine Raten bei den Kellnern ein exaktes Clopper-Pearson-Konfidenzintervall zur Vertrauenswahrscheinlichkeit von 95 %, so erlebt man auch eine kleine Überraschung: Für die rohe Rate 1,08 der männlichen Kellner reicht es von 0,22 bis 3,16, für die rohe Rate 0,61 der Kellnerinnen von 0,17 bis 1,56. Diese Konfidenzintervalle schließen die Raten aus der Allgemeinbevölkerung ein, d.h. der Unterschied, den Grieshaber gegen die gesammelte wissenschaftliche Evidenz geltend macht, wäre nicht einmal statistisch signifikant.
Schlechte Daten, schlechte Taten
Man könnte weitere Schwachstellen diskutieren, ich verzichte darauf, weil spätestens anhand der letzten beiden Punkte klar geworden sein dürfte, dass diese Daten sich „mit ausreichender Sicherheit“ nicht für die weitreichenden Aussagen Grieshabers eignen. Grieshaber hat hier – aus welchen Motiven auch immer – einen im Wortsinne unvergleichlichen Zahlenbrei präsentiert, der aufgrund der großen Populationszahlen Eindruck schinden soll, aus dem aber nichts von dem abzuleiten ist, was er behauptet. Epidemiologie geht anders.
Und noch eine Anmerkung zum eigentlichen Anliegen Grieshabers: Selbst wenn die Lungenkrebsrate der Kellner niedriger läge als die der Allgemeinbevölkerung – was nicht der Fall ist -, würde das natürlich nicht belegen, dass Tabakrauch das Lungenkrebsrisiko der Kellner nicht erhöht. Es würde dann ohne Tabakrauch eben noch niedriger liegen. Bei dieser Frage geht es um das tabakrauch-attributable Risiko, für dessen Ermittlung epidemiologische Studien mit Confounder-Kontrolle nötig sind, wie zu betonen ansonsten auch Grieshaber nicht müde wird. Sein Ratenvergleich ist von solchen Studiendesigns meilenweit entfernt – jede Milchmädchenrechnung hat mehr zu bieten. Insofern hat der Journalist Dietmar Jazbinsek schon vor Jahren alles zur Grieshaberschen Rechenkunst gesagt, was zu sagen ist: Das ist “Gequassel für den Qualm”.
Umso ärgerlicher ist es, dass Grieshaber seine Zahlenspielereien nach wie vor unverdrossen gegen einen besseren Nichtraucherschutz in der Gastronomie in Stellung bringt, derzeit im Zusammenhang mit der Novellierung des Nichtraucherschutzes in Nordrhein-Westfalen. Er kämpft gegen die Prävention unter dem Deckmantel der Wissenschaft – und das als Professor für Angewandte Prävention und Gesundheitsförderung. O tempora, o mores.
Nachtrag 11.10.2012: Ein Kollege hat mich nach dem Konfidenzintervall für die SIR gefragt. Bei den kleinen Fallzahlen kann man z.B. auf der Grundlage der Poissonverteilung ein Konfidenzintervall nach Breslow/Day berechnen. Es reicht für die SIR von 0,7 bei den Männern von 0,14 bis 2,04 und für die SIR von 0,96 bei den Frauen von 0,26 bis 2,46. Die SIR ist auf “1” normiert, d.h. wenn die 1 im Konfidenzintervall liegt, ist der Unterschied der Untersuchungspopulation (Kellner) gegenüber den Referenzpopulation (Krebsregister) statistisch nicht signifikant. Zur Methode siehe Breslow/Day: Statistical methods in cancer research, 1987. Vorsicht Herr Grieshaber, das ist eine WHO/IARC-Publikation.
Kommentare (291)