Es gibt natürlich Verfahren, um dieses Problem
zu lösen. Eines davon ist die sogenannte Bonferroni-Korrektur, die im
wesentlichen verlangt, dass das Signifikanzniveau durch die Anzahl der
Tests dividiert wird. Führt man 21 Tests durch, so ersetzt man das 5%
Niveau also durch ein 0,24% Niveau. Ein positives Resultat liegt somit
vor, wenn man einen p-Wert findet, der kleiner als 0,0024 ist. Wendet
man die Bonferroni-Korrektur auf Tabelle 02 an, so bleiben genau drei
statistisch auffällige Übereinstimmungen über: Die Rutengeher 1, 2 und
3 weisen eine nicht überaus hohe, aber doch kaum durch Zufall zu
erklärende Übereinstimmung in der Ortung von “Störzonen” auf. Gibt es dafür eine Erklärung, die ohne “Erdstrahlen” auskommt? Die EZU-Studie selbst liefert dafür einen interessanten
Hinweis:
Mit dem zweiten
Vorversuch verhält es sich wie mit dem ersten. Von acht Rutengehern war
für einen kein Kappa berechenbar, da er den gesamten Raum als eine
einzige riesige Störzone klassifizierte. Nach Bonferroni-Korrektur
bleiben von den anfänglich elf signifikanten Resultaten genau drei
übrig. Eines dieser drei ist ein statistisch signifikant negatives
Kappa von -0,25 zwischen Rutengeher 4 und 5. Signifikant positiv sind
die Paare (2,4) und (4,6). Allerdings bezieht sich die Übereinstimmung
zwischen 2 und 4 offenbar auf eine andere Gruppe von “Störzonen” als
die zwischen 4 und 6, denn zwischen 2 und 6 findet sich keine
signifikante Übereinstimmung (p = 0,13).
Was soll man davon
halten? Ignorieren wir für den Moment die Hinweise darauf, dass es
möglicherweise bewusste oder unbewusste Absprachen innerhalb einer
gemeinsam angereisten Gruppe von Rutengehern gab. In Summe haben wir
dann bei den ersten beiden Vorversuchen 5 signifikant positive
Übereinstimmungen bei 49 Paarvergleichen. Eine wohlwollende Folgerung aus diesen
Daten wäre also:
Lässt man einen Wohnraum durch zwei “renommierte”
Rutengeher unabhängig voneinander untersuchen, so liegt die
Wahrscheinlichkeit bei etwa 90%, dass man KEINE auch nur halbwegs
übereinstimmenden Resultate erhält. Und falls doch, dann gibt es wegen
der fehlenden Validität keine Anhaltspunkte dafür, dass die gefundenen
“Störzonen” irgendeinen Menschen tatsächlich stören.
(2) Vorversuche 3 & 4: Validierung des Rutengehens
Die Hypothese des EZU ist, dass eine “geopathogene” Zone auf das vegetative Nervensystem der Probanden einwirken würde, ohne dass diese es bewusst wahrnehmen. Dies sollte sich in Stressreaktionen des Körpers bemerkbar machen, die gemessen werden können. Vermehrter Stress bewirkt eine erhöhte Schweißdrüsenaktivität, was den Hautwiderstand herabsetzt. Ebenso sollte eine erhöhte Körpertemperatur und eine erhöhte Pulsfrequenz nachweisbar sein.
2.1 Messung des Hautleitwerts
Im
Vorversuch 3 wurde an 14 Testpersonen die Hautleitfähigkeit gemessen
(skin conductance level, SCL: Kehrwert des ohmschen Hautwiderstands,
eigentlich Hautleitwert). Dies geschah an je einem “neutralen” und
einem “geopathogenen” Platz, die von fünf Rutengehern zuvor gemeinsam
bestimmt wurden. Die Probanden und die Studienleitung waren dabei
verblindet, wussten also nicht, welcher Platz welcher war. Auf beiden
Plätzen wurden dabei sowohl in der ersten als auch in der achten Minute
Messungen vorgenommen, in der Annahme, dass die Auswirkungen der
“Erdstrahlen” sich erst im Laufe von einigen Minuten auf die gemessenen
Parameter auswirken würden.
Vergleichen wir die mittlere SCL der
14 Probanden in der achten Minute: Auf dem neutralen Platz betrug sie
12,59 Mikrosiemens mit einer Standardabweichung von 6,61. Auf dem
“geopathogenen” Platz waren es 14,14 Mikrosiemens mit einer
Standardabweichung von 8,13. Die beiden Mittelwerte differieren also um
kaum ein Fünftel der Standardabweichung. Intuitiv würde man schätzen, dass das bei 14 Probanden keinesfalls einen statistisch
signifikanten Unterschied ausmachen kann, wir es hier also mit einem
klassischen Nullresultat zu tun haben. Um diese Einschätzung konkret zu
machen, bedarf es eines statistischen Tests. Was die EZU-Studie nun tut, ist völlig absurd. Sie schafft es, bei diesem einfachen Test gleich zwei schwere Fehler einzubauen!
Erster Fehler: Sie verwendet den falschen Test. Laut EZU-Studie wurde zum Vergleich der Daten der Mann-Whitney-U-Test verwendet. Damit testet man, ob zwei unabhängige
Stichproben aus derselben Verteilung stammen. Im vorliegenden Fall sind
die beiden Stichproben aber natürlich nicht unabhängig, sondern gepaart. Man hätte also einen Wilcoxon-Vorzeichen-Rang-Test durchführen müssen.
Zweiter Fehler: Sie rechnet mit einem um den Faktor 700 (!) überhöhten Stichprobenumfang.
Aus Tabelle 07 der Studie ist ersichtlich, dass für den Stichprobenumfang N = 9830
gesetzt wurde:
Kommentare (52)