Die Annahme der Chi-Quadrat-Verteilung für X2 gilt nur dann als realistisch, wenn alle erwarteten Häufigkeiten mindestens 5 betragen. In seiner 1924 erschienenen Arbeit „On a distribution yielding the error functions of several well known statistics“ stellte Fisher neben Pearsons Chi-Quadrat-Test und Gossets t-Test einen neuen Signifikanztest vor, der anders als die anderen Tests auch bei sehr niedrigen Fallzahlen funktionieren sollte. Um den Zusammenhang zweier Eigenschaften zu testen, verglich er die beobachteten Anzahlen a,b,c,d für die vier möglichen Kombinationen der zwei Eigenschaften mit denen, die man bei Unabhängigkeit der beiden Eigenschaften zu vorgegebenen Werten von a+b,c+d,a+c,b+d bekommen müßte.
Im Falle der Unabhängigkeit der beiden Eigenschaften bewies er, dass man dann eine hypergeometrische Verteilung bekommen müsse, also z.B. .
Um einen Zusammenhang der beiden Eigenschaften zu beweisen, sollte die Abweichung der beobachteten Häufigkeiten von der hypergeometrischen Verteilung ein gewisses Signifikanzniveau überschreiten. Er postulierte (durchaus umstritten) ein Signifikanzniveau von 5%, oberhalb dessen ein signifikanter Zusammenhang der beiden Eigenschaften anzunehmen sei. Auf diese Zahl kam er, weil eine signifikante Abweichung seiner Meinung nach doppelt so groß sein sollte wie die Standardabweichung, was er auf die Normalverteilung anwandte.
Der Test kann auf mehr als zwei Eigenschaften erweitert werden. Obwohl er für alle Testgrößen funktioniert, wird er in der Praxis vor allem bei kleinen Größen angewandt. Neben dem t-Test und dem Chi-Quadrat-Test ist er einer der meistverwendeten Tests geblieben. Kritik an statistischen Tests gibt es aber immer wieder, weil von ihnen auch durchaus existierende Zusammenhänge als statistisch nicht signifikant verworfen werden können.
Bild: https://commons.wikimedia.org/wiki/File:Youngronaldfisher2.JPG#mw-jump-to-license
Kommentare (6)