Am letzten Sonntag ist Paul Meier im Alter von 87 gestorben, einer der bekanntesten Statistiker, der große Verdienste um die Gesundheit der Menschheit hat. Mit blöder Statistik? Mit blöder Statistik! Denn Paul Meier hat in den 50er Jahren vehement dafür gekämpft, dass randomisierte Studien das Standard-Protokoll für medizinische Wirksamkeitsstudien waren.
Und das mag eine der größten Errungenschaften in der wechselhaften Beziehung zwischen ernsthaft gedachter Wissenschaft und Menschlichkeit sein. Bei randomisierten Studien möchte man die Wirksamkeit eines neuen Medikamentes oder einer neuen Methode im Vergleich zu einer Kontrollgruppe testen, die beispielsweise weiter mit der etablierten Methode behandelt wird. Solange man nicht weiß, ob das neue Medikament auch wirklich besser ist, ist das ja auch ethisch völlig in Ordnung. Nur die Menschlichkeit sieht das anders, und die Hoffnung auf eine bessere Heilmethode kann die Einteilung in die Gruppen beeinflussen. Siddhartha Mukherjee schreibt darüber in The Emperor of all Maladies. Wie z.B. erste Ideen zur Randomisierung darin bestanden, dass der oder die Rezeptionist_in die Patient_innen abwechselnd in die beiden Gruppen schreiben sollte. Müsste zufällig sein, oder? Aber was, wenn der Rezeptionist eine Freundin hatte, die teilnehmen wollte? Er könnte sie in die Gruppe schmuggeln, die das neue Medikament testet. Und leider ist das ein Problem, das Studien völlig zerstören kann. Die gemessenen Effekte sind oft klein oder sehr schwierig genau zu messen, und der Verdienst der früheren Statistiker wie Paul Meier ist, zu erkennen dass nur ordentliches Studiendesign und ordentliche Statistik diese Effekte auflösen kann. Wenn man die neue Methode an Millionen Menschen testen könnte, dann wäre die Studie sicher auch robuster gegen solche Manipulationen – aber so ist das nun einmal nicht, die Gruppengrößen sind begrenzt. Oft sind auch die Effekte sehr klein, oder komplex, sodass z.B. jahrelang Studien zu Brustkrebsscreening an solchen “Details” scheiterten.
Der Verdienst von Meier war aber, erst einmal zu erkennen, dass man Medikamente überhaupt so rigoros testen konnte…ja musste:
‘When I said “randomize” in breast cancer trials I was looked at with amazement by my clinical colleagues’ said Meier in an interview in 2004. ‘ “Randomize? We know this treatment is better than that one” they said. I said “Not really…”
In der Statistik ist Meier für den Kaplan-Meier-Schätzer bekannt. Das Problem schließt sich sofort an, wenn man Experimente durchführt um die Wirksamkeit eines Medikamentes zu messen – und befasst sich damit wie man den Faktor Mensch in der Statistik einbringt.
Denken wir uns eine Studie zu einem Krebsmedikament, zu dem wir messen wollen, wie die Überlebensrate ist. Das erscheint zunächst einfach: Wir zählen einfach nach jedem Jahr, wieviele Patienten noch leben.
Jetzt gibt es aber Probleme mit solch langfristigen Studien: Manche Patienten ziehen vielleicht um und vergessen, das den Forschern mitzuteilen. Oder sie haben keine Lust mehr, und melden sich deswegen nicht mehr. Oder vielleicht löschte die Katze der Hausmeisterin sie aus Versehen aus der Datenbank, als sie eine Plastikmaus über die Tastatur jagte. Wie auch immer, es werden Patienten verloren gehen, über deren Verbleib man nichts weiß.
Wie geht man nun damit um? Wenn man sie komplett aus der Studie löscht, verliert man nicht nur statistisches Gewicht, man löscht auch Informationen. Nehmen wir an, ein Patient verlässt die Studie im dritten Jahr. Wir wissen nicht, wo er ist, ob er noch lebt oder nicht. Aber wir haben trotzdem Informationen: Nämlich dass er Jahr 1 und 2 überlebt hat. Ihn ganz aus der Studie zu löschen würde diese verfälschen!
In ihrem Paper von 1958 (PDF) entwickelten Kaplan und Meier daher sozusagen einen Algorithmus, um dieses menschliche Verhalten in der Mathematik abzubilden.
Nehmen wir an, im ersten Jahr sterben von 100 Teilnehmern 3 und 2 verschwinden, ohne dass wir wissen, wo sie sind. Dann nehmen wir an, dass diese 2 das erste Jahr überlebt haben, nehmen sie aber ab dem zweiten Jahr aus der Studie. Im zweiten Jahr versterben 3 weitere Studienteilnehmer. Dann ist die Überlebensrate nach dem ersten Jahr 97/100 und die Wahrscheinlichkeit, das zweite Jahr zu überleben, ist 97/100 * 92/95 = .939.
Denn das zweite Jahr beginnt man mit 100 – 3 – 2 = 95 Patienten, und es sterben drei davon. Wer auch immer im zweiten Jahr aus der Studie unbekannt ausscheidet, wird erst danach abgezogen.
Natürlich wird diese Rechnung mit vielen Jahren etwas länglich, aber dank der Sprache der Mathematik kann man den Kaplan-Meier Produktlimit-Schätzer auch so schreiben:
mit ni Patienten zu Beginn von Zeiteinheit ti , von denen di in dieser Zeiteinheit sterben. Wendet man diese Formel in beiden Studiengruppen an, kann man mit der Zeit Unterschiede im Überleben in einem Graph darstellen.
Diese Formel lässt sich natürlich nicht nur auf medizinische Studien anwenden, sondern z.B. auch auf Studien zu Materialermüdung etc.
Kommentare (3)