Dieser Artikel ist Teil einer fortlaufenden Besprechung des Buchs “Wenn Gott würfelt: oder Wie der Zufall unser Leben bestimmt” (im Original: “The Drunkard’s Walk: How Randomness Rules Our Lives”) von Leonard Mlodinow. Jeder Artikel dieser Serie beschäftigt sich mit einem anderen Kapitel des Buchs. Eine Übersicht über alle bisher erschienen Artikel findet man hier.
——————————————————-
Im ersten Kapitel des Buchs hat Mlodinow anschaulich dargelegt, wie sehr der Zufall unser Leben bestimmt und vor allem dort, wo wir nicht damit rechnen. Das zweite Kapitel hat sich mit den grundlegenden Regeln der Wahrscheinlichkeit beschäftigt. Im dritten Kapitel präsentiert Mlodinow das fiese Ziegenproblem, das unser Unverständnis der Wahrscheinlichkeit eindrucksvoll präsentiert. Das vierte Kapitel beschäftigt sich mit den Methoden zur Berechnung von Wahrscheinlichkeiten die vor allem Blaise Pascal im 17. Jahrhundert entwickelt hat. Das fünfte Kapitel beschäftigt sich mit der Frage, was Wahrscheinlichkeiten in der realen Welt eigentlich bedeuten.
Und in Kapitel 6 wird es verwirrend… Denn da geht es um Thomas Bayes und seinen kleinen aber relevanten Beitrag zur Wahrscheinlichkeitsrechnung. Ein Beitrag, der für das Verständnis von Wahrscheinlichkeiten im Alltag von enormer Bedeutung ist, aber sehr oft ignoriert wird. Bayes hat sich mit den bedingten Wahrscheinlichkeiten beschäftigt, also mit der Frage, wie die Wahrscheinlichkeit eines Ereignisses von der Wahrscheinlichkeit eines anderen Ereignisses abhängt.
Ein Beispiel: Ein Mann nimmt nach der Arbeit heimlich Tanzstunden. Seine Frau merkt, dass er immer später nach Hause kommt und schließt daraus, dass er ein Verhältnis hat. Denn warum sonst sollte er ihr die Wahrheit über das verschweigen, was er nach der Arbeit tut. Wenn er eine Affaire hat, dann ist die Wahrscheinlichkeit gröer, dass er über seine “Überstunden” lügt als wenn er keine Affaire hätte. Aber hier hat sie die bedingten Wahrscheinlichkeiten durcheinander gebracht. Da ist einmal die Wahrscheinlichkeit, dass der Mann lügt, wenn er eine Affaire hat. Und dann die Wahrscheinlichkeit, dass er eine Affaire hat, wenn er lügt. Beide Wahrscheinlichkeiten sind nicht gleich groß und dürfen nicht verwechselt werden!
WIE wichtig das ist, weiß Mlodinow aus eigener Erfahrung. Im Jahr 1989 bekam er einen Anruf von seinem Arzt der ihm erklärte, dass er mit einer Wahrscheinlichkeit von 99,9 die nächsten 10 Jahren nicht überleben wird. Das ist natürlich keine sonderlich erfreuliche Nachricht sondern kommt einem Todesurteil gleich. Aber Mlodinow ist immer noch lebendig und die erschütternde Aussage seines Arztes ist nur schlechter Statistik zu verdanken.
Mlodinow hatte für seine Lebensversicherung einen HIV-Test absolviert und wurde positiv getestet. Der Test ist natürlich nicht perfekt. Wird er auf 1000 nicht-infizierte Blutproben angewandt, dann liefert er im Durchschnitt einmal ein falsches Ergebnis und behauptet, das Blut wäre infiziert obwohl es das nicht ist. Daraus hat der Doktor geschlossen dass der Test in 999 von 1000 Fällen richtig und Mlodinow mit einer Wahrscheinlichkeit von 99,9 Prozent mit HIV infiziert ist. Aber das ist falsch. Der Arzt hat wieder zwei bedingte Wahrscheinlichkeiten verwechselt. Die Wahrscheinlichkeit dass Mlodinow positiv getestet wird, wenn er nicht HIV-positiv ist und die Wahrscheinlichkeit, dass Mlodinow nicht HIV-positiv ist, wenn er positiv getestet wird.
Um den Fehler des Arztes zu verstehen, muss man sich die Sache ganz genau ansehen und das Theorem von Bayes ist die korrekte Methode das zu tun. Es reicht nicht, sich einfach nur die Daten aller Menschen anzusehen, die den HIV-Test absolviert haben. Bayes’ Theorem ermöglicht es, zusätzliche Informationen zu inkludieren und sie zu benutzen um die Wahrscheinlichkeiten von Ereignissen neu festzulegen. Mlodinow ist ein weißer männlicher heterosexueller Amerikaner der keine Drogen nimmt und gehörte damit 1989 zu keiner der klassischen Risikogruppen. Es macht also Sinn, sich bei der Untersuchung der Wahrscheinlichkeiten auf die Gruppe zu beschränken, zu der auch Mlodinow gehört. Außerdem muss man alle Möglichkeiten untersuchen, die bei der Auswertung des Tests auftreten können. Dazu gehören die Fälle, in der eine Person positiv getestet wird, die HIV-positiv ist (“richtig-positiven” Fälle); die Fälle in der eine Person positiv getestet wird, die nicht HIV-positiv ist (“falsch-positiv”); die Fälle in der eine Person negativ getestet wird, die nicht HIV-positiv ist (“richtig-negativ”) und die Fälle in der eine Person negativ getestet wird, die HIV-positiv ist (“falsch-negativ”). Erst wenn man weiß wie wahrscheinlich all diese Fälle sind, kann man korrekte Aussagen über den Test machen.
Die entsprechenden Statistiken besagen, dass von 10.000 getesteten weißen männlichen heterosexuellen Amerikanern die keine Drogen nehmen im Durchschnitt eine Person mit HIV infiziert ist. Die falsch-negativ-Rate des Tests ist quasi gleich null; d.h. es kommt nicht vor, dass jemand übersehen wird, der tatsächlich HIV-positiv ist. Der Test wird bei den 10.000 Personen also auf jeden Fall ein positives Resultat liefern das auf die tatsächliche Infektion der eine Person zurückzuführen ist. Die Wahrscheinlichkeit, dass der Test ein positives Resultat liefert obwohl die Person nicht infiziert ist, also die falsch-positiv-Rate liegt aber bei den vom Doktor erwähnten 0,01 Prozent (1 falsches Ergebnis von 1000). Bei den 10.000 getesteten Menschen sind das also 10, die ein positives Resultat erhalten obwohl sie nicht infiziert sind. Insgesamt sind es 11 Leute von 10.000 die ein positives Testresultat erhalten obwohl nur einer davon tatsächlich infiziert ist. Wenn man zu dieser Gruppe gehört, dann besteht eine Chance von 10 zu 11, also mehr als 90 Prozent, dass man nicht infiziert ist, obwohl der Test ein positives Resultat geliefert hat!
Der Doktor hätte Mlodinow also sagen müssen, dass er mit einer Wahrscheinlichkeit von 90 Prozent nicht HIV-positiv anstatt ihm zu erzählen, dass er mit einer Wahrscheinlichkeit von 99,9 Prozent infiziert ist. Der Unterschied liegt im Bayesschen Theorem und den zusätzliche Informationen. Die Statistiken sagen nämlich auch, dass bei 10.000 Menschen aus der Risikogruppe im Durchschnitt 100 tatsächlich infiziert sind (und nicht nur einer wie in der Nicht-Risikogruppe zu der Mlodinow gehört). Es gibt nun also 100 richtig-positive Fälle und weiterhin 10 falsch-positive Fälle. Bekommt man ein positives Resultat besteht nun eine Chance von 10 zu 11 das man tatsächlich infiziert ist, wenn man ein positives Resultat bekommen hat.
Die bedingten Wahrscheinlichkeiten sind tatsächlich ziemlich hinterhältig und wenn man sie vernachlässigt, kann das schnell dramatische Folgen haben. Das fängt dubiosen Statistiken in Esoterik und Pseudowissenschaften, wo man nur die richtig-positiven Fälle betrachtet (“Mein Horoskop hat das Erdbeben korrekt vorhergesagt”), aber die falsch-positiven Fälle (Erdbeben wurden nicht vorhergesagt und haben nicht stattgefunden) genauso ignoriert wie die richtig-negativen Fälle (Erdbeben wurden vorhergesagt und haben nicht stattgefunden) und die falsch-negativen (All die Erdbeben die stattgefunden haben ohne vorhergesagt zu werden). Ich habe das früher schon mal ausführlich erklärt und festgestellt, dass es enorm einfach ist, eine scheinbar unfehlbare Methode für was auch immer zu entwickeln. Einen HIV-Test mit 100 prozentiger richtig-positiv-Rate zu entwerfen, ist simpel. Man muss einfach nur bei jeder Person behaupten, dass sie infiziert ist. Damit ist sicher gestellt, dass JEDE Person, die infiziert ist, von diesem Test auch erkannt wird. Aber man produziert eben auch eine gigantische falsch-positiv-Rate die den “Test” völlig wertlos macht.
Bayes’ Theorem ist seit dem 18. Jahrhundert bekannt, hat sich aber immer noch nicht im Bewusstsein der Menschen durchgesetzt. Mlodinow berichtet von einer Studie, bei der Ärzte vor folgendes Problem gestellt wurden:
Wie wahrscheinlich ist es, dass eine Frau zwischen 40 und 50 Jahren die keine spezifischen Symptome zeigt an Brustkrebs leidet, wenn sie ein positives Mammographie-Resultat erhält? 7 Prozent der Mammographien zeigen Krebs an, obwohl keiner vorhanden ist. Die Statistik zeigt, dass 0,8 Prozent der 40 bis 50jährigen Frauen ohne spezifische Symptome tatsächlich an Brustkrebs leiden. Die falsch-negativ-Rate des Tests beträgt 10 Prozent.
Mit Bayes’ Theorem läst sich die gesuchte Wahrscheinlichkeit genau ausrechnen und sie beträgt in diesem Fall 9 Prozent. Nur 9 Prozent der 40 bis 50jährigen Frauen ohne Symptome haben (in diesem Beispiel) tatsächlich Brustkrebs wenn die Mammographie Brustkrebs anzeigt. Ein Drittel der befragten Ärzte in Deutschland war allerdings der Meinung, es wären 90 Prozent und im Durchschnitt lagen die Antworten bei 70 Prozent. Dieser Unterschied zwischen dem, was wir intuitiv für die Wahrscheinlichkeit eines Ereignisses schätzen und der realen Wahrscheinlichkeit zeigt sich hier besonders dramatisch. Es macht einen enormen Unterschied, ob man nach einem Besuch beim Arzt erfährt, dass man zu 90 Prozent an Krebs leidet oder nur zu 9 Prozent!
Und wer nun denkt, er habe die bedingten Wahrscheinlichkeiten verstanden, für den gibt es noch eine Hausaufgabe. In Kapitel 3 ging es um die Frage, wie wahrscheinlich es ist, dass eine Familie mit zwei Kindern zwei Mädchen hat, wenn bekannt ist, dass zumindest eines der Kinder ein Mädchen ist. Das war im Prinzip schon eine bedingte Wahrscheinlichkeit nach Bayes und die Antwort betrug: 1 zu 3. Von den vier Möglichkeiten (Junge/Junge), (Junge/Mädchen), (Mädchen/Junge), (Mädchen/Mädchen) sagt uns die Zusatzinformation der “wenn”-Bedingung, dass wir den Fall (Junge/Junge) ignorieren können. Von den verbleibenden drei Möglichkeiten erfüllt nur eine die gesuchte Bedingung nach zwei Mädchen. Die Wahrscheinlichkeit beträgt also 1 zu 3. So weit, so klar. Aber wie lautet die Antwort auf diese Frage:
Eine Familie hat zwei Kinder. Wie groß ist die Wahrscheinlichkeit, dass beide davon Mädchen sind wenn bekannt ist, das eines der Kinder ein Mädchen mit dem Namen “Mechthild” ist?
Das mag nun vielleicht absurd klingen, aber für die Frage nach der Wahrscheinlichkeit spielt es tatsächlich eine Rolle, ob man den Namen des Mädchens kennt oder nicht und die Antwort auf diese Frage ist NICHT “1 zu 3”. Viel Spaß beim Suchen nach der Lösung (und wenn ihr die Antwort schon kennt weil ihr das Buch gelesen habt, dann verratet sie bitte nicht gleich in den Kommentaren!).
Kommentare (109)