Warum? Des Rätsels Lösung: Die SCL-Werte wurden durch
ein elektronisches Gerät gemessen, das bei jeder Person 15mal pro
Sekunde den Hautleitwert bestimmte. Da die Messung bei jeder Person
über etwas weniger als eine Minute durchgeführt wurde, erhielt man also
pro Person etwa 700 Einzelmesswerte. Anstatt nun für jede Person über diese
Einzelmesswerte zu mitteln und damit einen mittleren Hautleitwert pro Person zu
erhalten, wurden offenbar alle je 700 Einzelmesswerte aller 14 Personen in
einen Topf geworfen, was die absurde Zahl von N = 9830 ergibt. Eine
Konsequenz daraus ist, dass jeder statistische Test einen
hochsignifikanten Mittelwertsunterschied anzeigt, weil die Software nun
“glaubt”, dass auf jedem Platz 9830 Testpersonen gemessen wurden!
2.2 Temperatur- und Pulsfrequenzmessung
Im Vorversuch
4 wurde – wieder an 14 Probanden – neben der SCL auch die periphere
Temperatur und die Pulsfrequenz gemessen und die auf dem “neutralen”
und dem “geopathogenen” Platz erhaltenen Mittelwerte verglichen. Der Versuch krankt an denselben Fehlern wie der vorangegangene. Da die
Abtastrate des Messgeräts hier sogar 20 Hz (in der Studie 20 Hz/Sek
genannt) beträgt, rechnete man statt mit N = 14 mit N = 16943.
Resultat: Die winzigen Unterschiede in den Mittelwerten werden sofort
zu hochsignifkanten Abweichungen erklärt. Dass das an der extrem hohen “Anzahl der Datenzeilen”
liegt, verschweigen die Studienautoren dabei nicht einmal. Auf die
Idee, die offensichtliche Korrektur durchzuführen, kommen sie anscheinend nicht. Das ist umso verwunderlicher, als einer der Studienautoren an einer Fachhochschule einen Statistik-Grundkurs unterrichtet.
(3) Vorversuche 5 & 6: EAV-Messungen
3.1: Elektroakupunktur nach Voll (EAV)
Der fünfte Vorversuch demonstriert eine erstaunliche Naivität in der Studienplanung. Obwohl ausreichend bekannt ist, dass die Elektroakupunktur nach Voll (EAV) ein einfach zu manipulierendes Voodoo-Verfahren
ist, wurde diese Messung des Hautwiderstands an eingebildeten
Akupunkturpunkten in völliger Ernsthaftigkeit durchgeführt. Wie üblich
geschah dies auf einem “neutralen” und einem “geopathogenen” Platz. Da
die ersten Resultate nicht wie erwünscht ausfielen,
wurde noch während der Versuchsreihe das Protokoll geändert. Danach stellten sich plötzlich dramatische
Unterschiede ein.
Man muss den
EZU-Autoren hier zugute halten, dass sie sich der Ernsthaftigkeit dieser
Probleme zumindest im Nachhinein bewusst wurden und die EAV-Messung für den später stattfindenden Hauptversuch nicht mehr zum Einsatz kommen ließen.
3.2 EAV-Messung ohne Experimentator-Verblindung
Der sechste und letzte Vorversuch liefert ebenfalls keine neuen Erkenntnisse. Hier
wurde im wesentlichen der vierte Vorversuch mit dem fünften verknüpft.
Fehler wurden keine korrigiert: Der falsche Test wurde ebenso wieder
verwendet wie der überhöhte Stichprobenumfang. Die EAV-Messungen wurden
von Beginn an nur einfach-verblindet durchgeführt, was zu “schönen”, aber wertlosen Daten führte. Bei den biometrischen Messungen wurde mit N = 15652 Messwerten gerechnet. Sämtliche
Mittelwertdifferenzen sind minimal, aber aufgrund des mehr als
tausendfach überhöhten Stichprobenumfangs fälschlicherweise als
hochsignifikant ausgewiesen. Leider weisen die Mittelwert-Unterschiede beim Hautleitwert außerdem in die
“falsche” Richtung, der “geopathogene” Platz war demnach eher entspannend.
Dass sich die Pulsfrequenz eines Menschen nicht mit einer Abtastrate von 20 Hz bestimmen lässt, sollte eigentlich durch Einsatz elementarer Logik erkennbar sein. Wenn ein elektronisches Messgerät wie hier der “Physiorecorder der Firma Schuhfried”
vorgibt, genau das trotzdem zu tun, dann darf man sich nicht wundern,
wenn man für einen gesunden, auf einem “neutralen” Platz sitzenden
Probanden eine angebliche Pulsfrequenz von 197 erhält. Zumindest das haben die Studienautoren richtig erkannt.
(4) Fazit
Die mittlere Interrater-Reliabilität ist bestenfalls als minimal zu bezeichnen. Ein Paar von Rutengehern weist sogar einen signifikant negativen Kappa-Wert auf. Die wenigen statistisch signifikanten positiven Übereinstimmungen sind schwach und durch deutliche Hinweise auf mangelhafte Verblindung der Rutengeher erklärbar.
Die Validierung des Rutengehens ist gescheitert. Die mittleren Hautleitwerte unterscheiden sich nur minimal, und die Richtung der Differenz ist bei den zwei Versuchen unterschiedlich. Die Temperatur-Messungen ergeben einen minimalen und insignifikanten Unterschied. Die EAV-Messungen und die Messungen der Pulsfrequenz sind selbst aus Sicht des EZU unbrauchbar.
Kommentare (52)