Mein Blogger-Kollege Joseph Kuhn hat ja vor ein paar Tagen sein Fehlerrelativitätsgesetz postuliert:
In jedem längeren Text, egal wie viele Fehler man findet, bleiben immer mindestens 5 weitere Fehler. Wenn man Glück hat, nur einfache Schreibfehler, wenn man Pech hat, werden auch höhere intellektuelle Ansprüche erfüllt.
Nun hat ja schon Kishon behauptet, dass es seit Aristophanes schwer ist neue Witze zu machen, bzw. in seinen Worten:
Es ist sehr schwer, etwas Neues zu erdichten, seit Aristophanes vor 2500 Jahren damit angefangen hat, meine Ideen zu stehlen.
Leider ist die Wissenschaft unbarmherziger als der Satiriker: Etwas sehr Ähnliches zum Kuhnschen-Fehlerrelativitätsgesetz hat bereits George Pólya aufgestellt[Pólya, 1976]
– und brauchte dazu bloß eine halbe Seite.
Nehmen wir mal an, dass zwei Menschen einen Text nach Schreibfehlern durchsuchen. Das empfehle ich grundsätzlich all meinen Studenten und Studentinnen (es dürfen auch mehr Leute sein) und biete mich auch stets selber an. Der Erste finde 24 Fehler, der Zweite sieht 15; es gibt 12 Fehler, die beide gefunden haben. Wie viele unerkannte Fehler gibt es noch im Text?
Derartige Schätzungen über etwas was man nicht sieht kommen unter anderem bei Schätzungen in der Ökologie vor (z. B. Vogelzählungen). Alternativ kann man auch die sog. Rückfangmethode anwenden, die in der Ökologie noch häufiger angewendet wird und auch auf Fehlerschätzungen in Texten angewendet werden kann. Ich ziehe bei der Fehlersuche Pólyas Methode vor: Sie ist einfach und schlicht wie die Rückfangmethode. Letztere verlangt aber gleiche Wahrscheinlichkeiten für alle Fehler gefunden zu werden. Das halte ich für wenig realistisch. Einige springen einfach eher ins Auge als andere und zwischen LektorInnen gibt es auch Unterschiede in der Aufmerksamkeit bzw. dem Vermögen bestimmte Fehler zu finden.
Also schauen wir uns Pólyas Methode mal genau an: Im Allgemeinen findet LektorIn 1 Fehler, Nr. zwei findet , darunter gibt es eine Gruppe , die beide gefunden haben. Die zwei LektorInnen haben also insgesamt Fehler entdeckt. Außerdem nennen wir (von “misprint“) die Zahl der Gesamtfehler im Text – die aber unbekannt ist.
Wir brauchen dann noch zwei Zutaten: Nicht jede(r) LektorIn ist gleich gut bei der Textkontrolle. Die Chance, mit der Lektorin 1 einen best. Fehler im Text findet, nennen wir . Und die Chance, dass LektorIn 2 einen best. Fehler findet . Jetzt kann die eigentliche Arbeit beginnen: Nach den eisernen Regel der Wahrscheinlichkeitstheorie wird LektorIn Nr. 1 ungefähr Fehler im Text finden. Das notieren wir als (mit ~ anstelle von =, weil die Zahlen ja von einer Wahrscheinlichkeit abhängen, also ungefähr sind). Kommt LektorIn 2 an die Reihe so findet sie folglich Fehler. Weil beide unabhängig voneinander arbeiten, gilt für die Zahl, die sie beide finden .
Jetzt kommt der Schritt, der Nicht-Mathematikern mitunter seltsam anmutet, der aber ungemein praktisch ist: Pólya weiß, dass dasselbe ist wie mal irgendwas, geteilt durch dasselbe irgendwas. Irgendwie auf der Hand liegend, aber so kann man das Ganze besser aufbereiten:
Pólya wählt . Füllen wir jetzt ein, was wir gerade überlegt haben, erhalten wir . Anders gesagt: Die Qualität der LektorInnen spielt, wenn nicht ganz und gar lausig, keine Rolle bei der Schätzung wie viele Fehler übersehen wurden!
Pólya ist jetzt beinahe fertig: Die Gesamtzahl der unentdeckten Fehler ist weniger alle Fehler, die beide LektorInnen gefunden haben. Also gleich . Jetzt noch schön hinschreiben und wir erhalten:
Mit den Zahlen vom Anfang dürfen wir davon ausgehen, dass im hypothetischen Text noch 3 Fehler unentdeckt schlummern.
Die Schätzung ist nicht perfekt: Wenn beide LektorInnen genau die gleichen Fehler finden, schätzen wir beispielsweise mit Pólya immer null Fehler (und ignorieren Division durch 0). Aber bei praktischen Fragestellungen ist diese Schätzung äußerst nützlich. Und außerdem widersprechen Pólyas Methode und die Rückfangmethode dem Kuhnschen-Fehlerrelativitätsgesetz: Für die Zahl der unentdeckten Fehler ist es in beiden Fällen nämlich nicht egal, wie viele Fehler bereits entdeckt wurden.
Kommentare (15)