Mein Blogger-Kollege Joseph Kuhn hat ja vor ein paar Tagen sein Fehlerrelativitätsgesetz postuliert:

In jedem längeren Text, egal wie viele Fehler man findet, bleiben immer mindestens 5 weitere Fehler. Wenn man Glück hat, nur einfache Schreibfehler, wenn man Pech hat, werden auch höhere intellektuelle Ansprüche erfüllt.

Nun hat ja schon Kishon behauptet, dass es seit Aristophanes schwer ist neue Witze zu machen, bzw. in seinen Worten:

Es ist sehr schwer, etwas Neues zu erdichten, seit Aristophanes vor 2500 Jahren damit angefangen hat, meine Ideen zu stehlen.

Leider ist die Wissenschaft unbarmherziger als der Satiriker: Etwas sehr Ähnliches zum Kuhnschen-Fehlerrelativitätsgesetz hat bereits George Pólya aufgestellt[Pólya, 1976]
– und brauchte dazu bloß eine halbe Seite.

Nehmen wir mal an, dass zwei Menschen einen Text nach Schreibfehlern durchsuchen. Das empfehle ich grundsätzlich all meinen Studenten und Studentinnen (es dürfen auch mehr Leute sein) und biete mich auch stets selber an. Der Erste finde 24 Fehler, der Zweite sieht 15; es gibt 12 Fehler, die beide gefunden haben. Wie viele unerkannte Fehler gibt es noch im Text?

Derartige Schätzungen über etwas was man nicht sieht kommen unter anderem bei Schätzungen in der Ökologie vor (z. B. Vogelzählungen). Alternativ kann man auch die sog. Rückfangmethode anwenden, die in der Ökologie noch häufiger angewendet wird und auch auf Fehlerschätzungen in Texten angewendet werden kann. Ich ziehe bei der Fehlersuche Pólyas Methode vor: Sie ist einfach und schlicht wie die Rückfangmethode. Letztere verlangt aber gleiche Wahrscheinlichkeiten für alle Fehler gefunden zu werden. Das halte ich für wenig realistisch. Einige springen einfach eher ins Auge als andere und zwischen LektorInnen gibt es auch Unterschiede in der Aufmerksamkeit bzw. dem Vermögen bestimmte Fehler zu finden.

Also schauen wir uns Pólyas Methode mal genau an: Im Allgemeinen findet LektorIn 1 A Fehler, Nr. zwei findet B, darunter gibt es eine Gruppe C, die beide gefunden haben. Die zwei LektorInnen haben also insgesamt A + B - C Fehler entdeckt. Außerdem nennen wir M (von “misprint“) die Zahl der Gesamtfehler im Text – die aber unbekannt ist.

Wir brauchen dann noch zwei Zutaten: Nicht jede(r) LektorIn ist gleich gut bei der Textkontrolle. Die Chance, mit der Lektorin 1 einen best. Fehler im Text findet, nennen wir p. Und die Chance, dass LektorIn 2 einen best. Fehler findet q. Jetzt kann die eigentliche Arbeit beginnen: Nach den eisernen Regel der Wahrscheinlichkeitstheorie wird LektorIn Nr. 1 ungefähr M  \cdot p Fehler im Text finden. Das notieren wir als A \sim M \cdot p (mit ~ anstelle von =, weil die Zahlen ja von einer Wahrscheinlichkeit abhängen, also ungefähr sind). Kommt LektorIn 2 an die Reihe so findet sie folglich B \sim M \cdot q Fehler. Weil beide unabhängig voneinander arbeiten, gilt für die Zahl, die sie beide finden C \sim M \cdot p \cdot q.

Jetzt kommt der Schritt, der Nicht-Mathematikern mitunter seltsam anmutet, der aber ungemein praktisch ist: Pólya weiß, dass M  dasselbe ist wie M mal irgendwas, geteilt durch dasselbe irgendwas. Irgendwie auf der Hand liegend, aber so kann man das Ganze besser aufbereiten:

Pólya wählt M = \frac{M \cdot p \cdot M \cdot q}{M \cdot p \cdot q}. Füllen wir jetzt ein, was wir gerade überlegt haben, erhalten wir M \sim \frac{A\cdot B }{C}. Anders gesagt: Die Qualität der LektorInnen spielt, wenn nicht ganz und gar lausig, keine Rolle bei der Schätzung wie viele Fehler übersehen wurden!

Pólya ist jetzt beinahe fertig: Die Gesamtzahl der unentdeckten Fehler ist M weniger alle Fehler, die beide LektorInnen gefunden haben. Also gleich M - A - B + C. Jetzt noch schön hinschreiben und wir erhalten:

\hat{M}_{\mathsf{unentdeckt}} \sim \frac{(A-C) \cdot (B-C)}{C}

Mit den Zahlen vom Anfang dürfen wir davon ausgehen, dass im hypothetischen Text noch 3 Fehler unentdeckt schlummern.

Die Schätzung ist nicht perfekt: Wenn beide LektorInnen genau die gleichen Fehler finden, schätzen wir beispielsweise mit Pólya immer null Fehler (und ignorieren Division durch 0). Aber bei praktischen Fragestellungen ist diese Schätzung äußerst nützlich. Und außerdem widersprechen Pólyas Methode und die Rückfangmethode dem Kuhnschen-Fehlerrelativitätsgesetz: Für die Zahl der unentdeckten Fehler ist es in beiden Fällen nämlich nicht egal, wie viele Fehler bereits entdeckt wurden.

 

flattr this!

Kommentare (15)

  1. #1 StReiter
    unter den Wolken
    10. Juni 2020

    Vielen Dank für diesen Text, mit Fingerspitzengefühl und auf sehr humoristische Art das Kuhnsche Postulat entkernt.

    • #2 Christian Meesters
      10. Juni 2020

      Na ja, Herr Kuhn hat seinen Text mit Augenzwinkern geschrieben und ich habe (ihn) ihm ( 😉 ) meinen Text vorher gezeigt. Humor muss man halt haben.

  2. #3 Joseph Kuhn
    10. Juni 2020

    Ich habe keinen Humor, mir fehlt nur manchmal der nötige Ernst.

    Das Fehlerrelativitätsgesetz wird durch ein paar Formeln natürlich nicht widerlegt. Es hat schließlich eine ontologisch-emergenztheoretische Tiefendimension, die es metaphysisch wahr macht, im Sinne eines synthetischen Urteils a priori nach Kant.

    • #4 Christian Meesters
      10. Juni 2020

      Ich habe keinen Humor, mir fehlt nur manchmal der nötige Ernst.

      Da wage ich zu widersprechen: Dein Artikel zeigt schon den Humor, den nötigen Ernst fehlen zu lassen. 😉

      Das Fehlerrelativitätsgesetz wird durch ein paar Formeln natürlich nicht widerlegt.

      Wie so oft in der Wissenschaft: Wenn eine Hypothese und eine Schätzung sich widersprechen, sollte man genauer hinschauen, um dann ggf. die Hypothese falsifizieren zu können. Ungeachtet davon, erlaubt der Ansatz SchreiberInnen wissenschaftlicher Aufsätze oder Bücher eine schnelle Schätzung der Arbeit, die dringend zu investieren ist.

  3. #5 bote
    10. Juni 2020

    Fehlersuche,
    Beim Bau von Versuchuchsschaltungen in der Elektronik benötigt die Fehlersuche mehr Zeit, als wenn man die Elektronikschaltung neu baut.
    Wenn also der Fehler in der fehlerhaften Ausführung liegt, dann geht es schneller man wirft weg und baut neu.
    Bei der Software muss man unterscheiden zwischen Syntax Fehlern und logischen Fehlern. Hier muss man tatsächlich suchen.(Debugging) Dazu braucht man Fachfrauen/männer, die was von der Software verstehen.
    Ganz fehlerlos bekommt man eine Software selten bis nie, da so ein Programm sehr komplex ist. Man nimmt die Fehler inkauf. Deswegen wird Software in Module aufgegliedert, die die Fehlersuche einengen.

  4. #6 Christian Meesters
    10. Juni 2020

    @bote
    Ja, doch in beiden Fällen (Elektronische Schaltungen oder Software) sind die Fehler anderer Natur als bei freiem Text. Daher gelten die Annahmen der Rückfangmethode oder Pólyas nicht – ist ja klar.

    N.B. Bei Syntaxfehlern in Software sind Compiler bzw. Interpreter i.d.R. absolut perfekte Lektoren. Da braucht es keine menschl. Pendants. 😉

  5. #7 bote
    10. Juni 2020

    Christian Meesters,
    das ist schon richtig mit den Compilern und Interpretern. Nur wenn der Fehler eine Mischung aus Logik + Syntax ist, das Programm also läuft, nur nicht so, wie es sollte, dann wird es schwierig.
    Fehler in Texten zu finden, das ist auch nicht leicht, vorallem wenn es sich um Gebrauchsanleitungen handelt und der Lektor die Maschine nicht verstanden hat.
    Gibt es überhaupt freie Texte, das habe ich noch nicht durchschaut .

    • #8 Christian Meesters
      11. Juni 2020

      Können Sie ein Beispiel dafür geben, was eine Mischung aus Logik + Syntax-Fehler ist in einer gängigen Programmiersprache, der zwar ein lauffähiges Programm ergibt, aber dennoch von Compiler oder Interpreter nicht angemeckert wird? (Das ist zwar off-topic, wäre aber sehr interessant.)

  6. #9 Uli Schoppe
    11. Juni 2020

    Meine Compiler meckern alle Syntaxfehler an ^^

  7. #10 bote
    11. Juni 2020

    Christian Meesters,
    ein Beispiel aus VBA, mit dem ich zu kämpfen hatte, das war eine Programmzeile mit mehreren Klammern, also in sich verschachtelt, die nicht so arbeitete, wie es die Logik vorsah.
    Dann las ich zufällig in einer Fachzeitschrift, dass VBA bei einem bestimmten Befehl eine Verschachtelung anders interpretiert.
    Leider habe ich dieses Programm nicht mehr, den Befehl weiß ich auch nicht mehr.
    Da ich jetzt Java-Script bevorzuge, ist das auch kein thema mehr. Schade, wäre interessant gewesen, die Programmzeile zu analysieren.

    • #11 Christian Meesters
      12. Juni 2020

      Na ja, hier geht es also um eine Verallgemeinerung von einer Auffassung (der Eigenen), die sich auf eine andere (der des Zeitschriftenredateurs) beruft. Offengestanden denke ich nicht, dass sich daraus die Hypothese ableiten lässt, dass es möglich ist einen Fall zu finden, wo Syntax-Fehler unbemerkt von Compiler oder Interpreter durchgelassen werden [nachträglich zugefügt:] — außer im Falle sehr seltener und einschlägiger Compilerbugs. Umgekehrt ist es nicht selten so, dass wo wir Menschen einen Syntaxfehler nicht sehen, wir eine korrekte Syntax bauen (z. B. syntaktisch richtige Klammerung), die aber zu einem nicht gewünschten oder gar falschen Programmablauf führt. Das ist in gewisser Weise analog zu Fehlern, die wir in Prosatexten machen können: Auch hier kann trotz korrekter Grammatik und Rechtschreibung der Sinn entstellt sein. Hier schließt sich der Kreis zum Fehlerrelativtätsgesetz-Postulat. 😉

  8. #12 bote
    12. Juni 2020

    Christian Meesters,
    genau so ist es. Die deutsche Sprache erlaubt eine Vertauschung von Subjekt und Objekt, also von Nominativ und Akkusativ. Dann kommt es zu lustigen Ergebnissen.

  9. #13 rolak
    12. Juni 2020

    Vertauschung von Subjekt und Objekt, also von Nominativ und Akkusativ

    Gibt es eigentlich ein Antonym zu ‘UniversalGenie’?
    ~•~

    korrekte Syntax .. aber [nicht gewollter] Programmablauf

    Da dürften die meisten Probleme mit der Benennung haben, denn generell sind selbst Tippfehler (zB WurstfingerSchäden à la sqr()→sqrt() in Pascal) nicht unbedingt Syntaxfehler. Letzteres bezieht sich halt ausschließlich auf die Sprachdefinition – und so kann trotz eines ‘aber da fehlt doch eine öffnende Klammer’ syntaktisch korrekter Code entstehen (zB ‘gefräßige’ AbschlusZeichen wie in HTML).
    Zur Verdeutlichung der ähnlich gelagerten, klassischen ‘aber so war das doch gar nicht gemeint’-VerständnisLücke empfehle ich immer wieder gerne The Perl Jam (E1 E2).

    • #14 Christian Meesters
      14. Juni 2020

      sorry, war ‘ne Weile offline

      • #15 rolak
        14. Juni 2020

        Nix zu entschuldigen, war keineswegs dringend. Dafür aber leicht falsch – die ‘aber..Klammer’ sollte ‘schließend’ sein…