Zusammenhänge erfinden und so lange messen, bis irgendetwas statistisch signifikant wird, ist keine Wissenschaft.

Angenommen, ich möchte die heilende Kraft der Gedankenübertragung erforschen. Aus einer Gruppe von hundert Personen wähle ich fünfzig aus, denen ich dann einmal täglich, in einem Zustand tiefspiritueller Konzentration, positive Geistesenergie sende. Und nehmen wir an, nach vier Monaten stellt sich heraus, dass diese fünfzig Leute signifikant gesünder sind als die anderen fünfzig, denen ich keine Gedankenenergie gesendet habe. Beweist das dann die Wirksamkeit meiner Methode?

Nein, natürlich nicht: „Correlation does not imply causation.” Aber leider kommt es ziemlich oft vor, dass genau diese Herangehensweise, das bloße Suchen nach statistischen Zusammenhängen, ohne erkennbaren kausalen Zusammenhang, als Wissenschaft präsentiert wird.

Bei der Theorie über die heilende Gedankenübertragung ist die Sache ziemlich klar: Es gibt keinen bekannten Mechanismus, über den meine Gedanken den Gesundheitszustand anderer Leute beeinflussen könnten. Würde man solche Effekte finden, würde das wohl mehr Fragen aufwerfen als beantworten: Man müsste untersuchen, welche Eigenschaften diese mysteriöse geistige Energie hat, wie sie zum Energieerhaltungssatz passt, ob im Sinn der Informationstheorie Information übertragen wird, ob es sich um eine neuartige Strahlung handelt, die einem Abstandsgesetz gehorcht.

Es fällt schwer, sich vorzustellen, wie eine bisher unentdeckte Gedankenkraft beschaffen sein könnte, ohne in sich unlogisch und widersprüchlich zu sein, oder gegen die bekannten Naturgesetze zu verstoßen. Wenn wir einen statistisch signifikanten Effekt des Gedankenheilens finden, würden wir daher zunächst wohl vermuten, dass dieser Effekt durch bloßen Zufall zustande gekommen ist.

Szientabilität

Das erinnert an das Konzept der „Scientabilität“, das der Biologe und Wissenschaftsjournalist Christian Weymayr verwendet, um seine Bedenken gegenüber der Homöopathie zu erklären: Wissenschaftliche Untersuchungen homöopathischer Präparate, etwa Doppelblindstudien, sind nur bedingt sinnvoll, meint Weymayr. Die Aussagen der Homöopathie passen nicht zu den anerkannten Naturgesetzen, sie sind teilweise sogar in sich widersprüchlich, daher ist die Homöopathie nicht „scientabel“ – sie kann sich nicht in den großen Rest der Naturwissenschaft einfügen, von dem wir sehr genau wissen, dass er stimmt.

Ob man das Konzept der Homöopathie damit vom Tisch fegen kann, ob es sinnvoll ist, mit diesem Argument künftige wissenschaftliche Untersuchungen für sinnlos zu erklären, ist Geschmacksfrage. Aber die Grundidee dahinter ist wichtig: In der Wissenschaft genügt es nicht, irgendwelche Zusammenhänge zu suchen und „Heureka“ zu schreien, wenn man etwas statistisch Signifikantes gefunden hat. Man muss immer auch überlegen, wie die neue Erkenntnis – falls es denn wirklich eine ist – auf rational-wissenschaftliche Weise erklärt werden kann.

Bad Science: Signifikante Ergebnisse – für den Papierkorb

Wenn skeptische, wissenschaftlich denkende Menschen dieses Argument verwenden, um esoterischen Unfug zu entlarven, dann muss man allerdings ähnlich restriktive Maßstäbe auch an die echte Wissenschaft anlegen. Und da müssen wir ganz offen zugeben: Auch das, was von echten Wissenschaftlern mit ordentlichem Diplom an richtigen Universitäten produziert wird, wird solchen hohen Ansprüchen nicht immer gerecht. Das ist schade. Viel zu oft liest man von angeblich aufgedeckten Zusammenhängen, ohne dass ein kausaler Grund dafür erkennbar wäre.

So gibt es etwa eine ständig wachsende Zahl von Studien, die Lebensmittel mit Krebs in Verbindung bringen. Rotwein, Tomaten, Kaffee, rotes Fleisch – man findet Studien, die mit statistisch signifikanten Daten belegen, dass all diese Nahrungsmittel das Krebsrisiko fördern. Und dann findet man andere Studien, die von denselben Nahrungsmitteln behaupten, das Krebsrisiko zu mindern. Das bedeutet nicht, dass irgendjemand Daten manipuliert oder erfunden hat, das passiert nun einmal, wenn man nicht nach klaren Kausalketten sucht, sondern sich mit statistischen Korrelationen zufriedengibt.

Einen ähnlichen Fehler begeht man, wenn man nach Korrelationen zwischen Genen und menschlichem Verhalten sucht: Ein kausaler Zusammenhang ist kaum zu finden, dafür ist das System einfach zu komplex. Aber wenn man irgendwelche statistischen Korrelationen findet, kann man ein Paper darüber schreiben, und die Boulevardpresse verkündet dann begeistert die Entdeckung des „Mörder-Gens“, oder ähnlichen Unfug.

Auch wenn Psychologen Fragebögen austeilen und dann nach Korrelationen suchen, passiert oft Ähnliches: Wahlweise wird eine Affinität zu Videospielen mit mehr Gewaltbereitschaft, bösartigerem Verhalten im Straßenverkehr oder auch mit höherer Intelligenz in Verbindung gebracht. Man kann eine Studie über Religiosität und Empathie austeilen und dann behaupten, Ähnlichkeiten zwischen Psychopathen und Atheisten gefunden zu haben. Schön. Und was sagt uns das jetzt?

Erst die Theorie, dann das Datamining

Der Fehler ist immer derselbe: Es geht hier nicht um ein Modell, das einen Aspekt der Welt wirklich erklärt – zumindest nicht um ein ernstzunehmendes Modell, das zum Rest unseres Wissens passt. Die Frage nach Ursache und Wirkung, nach verständlichen Kausalketten, die ein entscheidendes Element der Wissenschaft ist, wird ausgeklammert, zufällig aufgetretene oder durch passende Auswahl der Fragen mutwillig provozierte Zusammenhänge werden aber trotzdem als Erkenntnisgewinn verkauft.

Die Wissenschaft muss kausale Zusammenhänge suchen und echte Erklärungen finden. Eine statistische Korrelation ohne darunterliegende solide Theorie ist noch keine Wissenschaft. Das bedeutet nicht, dass bloßes Sammeln und Auswerten von Daten nicht als erster Schritt eine gute Sache sein kann. Aber wir sollten solche Ergebnisse mit Vorsicht betrachten. Und keinesfalls sollten wir sie zum Anlass für großes Mediengeschrei verwenden. Es gibt ausreichend viel gute, saubere, verlässliche Wissenschaft, die sich für Schlagzeilen eignet.

 

Kommentare (44)

  1. #1 Walter Orlov
    August 29, 2016

    Ich glaube nicht, dass es heutzutage überhaupt anders geht. Besonders in der Grundlagenforschung ist die Wissenschaft längst an ihre Grenze gelangen. Die Ergebnisse der Experimente sind normalerweise stark verstreute Datenmengen. Man kann sie so und so aproximieren und deuten, am Ende gewinnt eine der etablierten Theorien. So bleibt die wahre Kasualität möglicherweise im Dunkeln.

  2. #2 Hav0k
    August 29, 2016

    Guter Artikel zu einem sehr wichtigen Thema. Deiner Analyse kann ich eigentlich nur zustimmen, sowohl was die grundsätzlichen Anforderungen an ein wissenschaftliches Konzept angeht, als auch hinsichtlich der Kritik an der Forschungspraxis vieler “echter” Wissenschaftler/innen.

    Mich interessiert vor allem Letzteres und die Ursachen dafür. Momentan sehe ich nämlich wenig Hoffnung an dieser Front: Der hohe Publikationsdruck zwingt zur Veröffentlichung von schnell durchführbaren, oft nur wenig relevanten Studien. Eine wirklich tiefgreifende Auseinandersetzung mit Forschungsfragen bleibt dabei oft auf der Stecke. Hinzu kommt, dass der Bevölkerungsanteil mit Abitur und Studienabschluss so hoch ist wie noch nie. Folglich drängen immer mehr Absolvent/innen in die Wissenschaft, was o.g Effekte noch potenziert. Insgesamt also eine bedenkliche Entwicklung hin zu mehr Quantität statt Qualität.

  3. #3 Joseph Kuhn
    August 29, 2016

    “Wenn wir einen statistisch signifikanten Effekt des Gedankenheilens finden, würden wir daher zunächst wohl vermuten, dass dieser Effekt durch bloßen Zufall zustande gekommen ist.”

    Sollte man in dem Fall nicht zuerst einmal vermuten, dass der Effekt durch einen systematischen Fehler, z.B. bei der Auswahl der 50 Gedankenenergieempfänger oder bei der Objektivität der festgestellten Befunde, zustande gekommen ist, also gerade nicht durch Zufall?

    Wenn man einmal von dem konkreten, angesichts des Stands der Wissenschaft evident unsinnigen Experiment absieht, sollte sich übrigens eine geringe a-priori-Wahrscheinlichkeit eines Effekts im Signifikanzniveau widerspiegeln, das dient ja der Abwehr einer zu schnellen Akzeptanz potentieller Zufallseffekte.

    Noch ein wichtiger Unterschied: der zwischen statistischer Signifikanz echter Effekte und ihrer klinischen Relevanz.

  4. #4 Gerald Fix
    August 30, 2016

    Das erinnert mich an die Schokolade-macht-schlank-Geschichte John Bohannons, die in Deutschland u.a. durch die Sciencebusters bekannt wurde. Erstaunlich, welche Suchmaschinentreffer zu “Schokolade abnehmen” auftauchen – einige der wenigen Zeitungen, die sich berichtigt haben, ist immerhin die BILD 🙂

    Wer’s nicht kennt: Bohannon hatte drei sehr kleine Gruppen gebildet; eine mit einer Schlankheitsdiät, eine mit einer Schlankheitsdiät plus Schokolade und eine ohne Diät. Dann hat er eine Vielzahl von Messungen durchgeführt und den statistischen Ausreißer – die Schoko-Gruppe hat etwas schneller abgenommen – in einem zweifelhaften Wissenschaftsjournal veröffentlicht. Über diese Veröffentlichung hat er dann die Medien bedient.

  5. #5 Joseph Kuhn
    August 30, 2016

    @ Gerald Fix:

    Die Schokodiät war seinerzeit auch auf Scienceblogs Thema:
    https://scienceblogs.de/geograffitico/2015/06/08/der-schokoladenstudienreport-ein-schlappe-fuer-den-journalismus/

  6. #6 werner
    August 30, 2016

    @Gerald Fix: Das mit der Schokolade lässt sich leicht erklären: So lange Kakao auf Bäumen wächst, ist Schokolade Obst 😉

  7. #7 Ulfi
    August 30, 2016

    Diese Haltung macht vielleicht aus Sicht eines Physikers Sinn, weil die betrachteten Systeme simpel sind, aber bereits in der chemie bricht das zusammen “was ist der unterschied zwischen einem Physiker und einem Chemiker? Der Physiker betrachtet ein Atom der Chemiker zwei”. In dem Moment wo die betrachteten Modelle komplex werden wird es schwierig vorhersagen zu treffen. So ist es in der Chemie noch heute vielfach so, dass man keine vorhersagen treffen kann aber aus Messergebnisse ableiten kann welches Modell zutrifft. Grosse teile der Biologie und Medizin müssen sogar ohne wirklich sinnvolle Modelle arbeiten weil die betrachteten Systeme zu komplex sind uns wir nur kleine Ausschnitte verstehen. Wie funktioniert ein Medikament? Keine Ahnung aber es wirkt und lindert die Symptome. Ich habe hier gerade ein Projekt aus der bioinformatik auf dem Tisch liegen. Da geht’s einfach nur drumherum vorherzusagen ob ein Protein auf einen Stoff anspricht- durch maschinenlernen. Gibt keine Modelle dafür, stand der Technik sind riesige explorative Studien um Kandidaten zu finden.

    In dem betrachteten Beispiel muss man auch sagen: wenn ein stabiler Effekt gemessen wird, dann macht es wenig Sinn den Effekt abzustreiten auch wenn man ihn nicht erklären kann. Natürlich ist das Experiment an den Haaren herbeigezogen eben weil man bei den ganzen esoterischen mitteln keinen stabilen Effekt kriegt während das wirksame Medikament reproduzierbar ist.

  8. #8 RPGNo1
    August 30, 2016

    Zitat: “Erst die Theorie, dann das Datamining”
    Das erinnert mich an die Diskussion in den 90er und 2000er Jahren, als nach mehreren Amokläufen an Schulen verschiedene Interessengruppen und Personen Druck ausübten, sogenannte “Killerspiele” (Ego-Shooter, Taktik-Shooter) gesetzlich verbieten zu lassen. Auch hier stand zuerst die Hypothese im Raum “Killerspiele machen gewalttätig”, dann wurde mit zweifelhaften Studien und falschen Korrelationen suggeriert, dass der angesprochene negative Einfluss vorhanden sei.
    Verschiedene Forscher, insbesondere aus den USA, haben ernsthafte Gegenstudien durchgeführt und dabei bewiesen, dass besagte Hypothese “Killerspiele machen gewalttätig” im Großen und Ganzen nicht zu halten ist.

  9. #9 schlappohr
    August 30, 2016

    “So ist es in der Chemie noch heute vielfach so, dass man keine vorhersagen treffen kann aber aus Messergebnisse ableiten kann welches Modell zutrifft.”

    Darin besteht ja auch kein grundsätzliches Problem, solange überhaupt ein Modell existiert, das durch Statistik untermauert werden kann. Und dass diese Methode auch bei sehr komplexen Zusammenhängen funktioniert, sieht man an den Arbeiten des Cern (Higgs-Nachweis, die Untermauerung einer Hypothese mit Mitteln der Statistik).
    Im Artikel ging es eher darum, dass viele Wissenschaftler (und die sich so nennen) Data Mining betreiben, ohne überhaupt eine Hypothese (also ein Wirkmodell) zu haben, dass sie damit untermauern könnten. Vermutlich könnte ich eine Korrelation zwischen dem Gemütszustand meines Dackels und der Erntemenge des Apfelbaums auf dem Nachbargrundstück nachweisen, wenn ich lange genug suche. Aber solange ich kein Kausalmodell dafür habe, sind die Daten völlig wertlos.

  10. #10 Walter Orlov
    August 30, 2016

    @Ulfi

    Ein Atom ist auch kompliziert genug:

    “Die Spektren der schwereren Elemente sind wegen der Vielzahl von Atomen und Energieniveaus, die besetzt werden können, außerordentlich linienreich. Wenn auch eine theoretische Behandlung nicht möglich ist, so besitzt die Spektroskopie erhebliche Bedeutung für die qualitative und quantitative Bestimmung von Elementen in Substanzproben.”

    https://www.chemgapedia.de/vsengine/vlu/vsc/de/ch/11/aac/vorlesung/kap_2/vlu/bohrsche_atommodell.vlu/Page/vsc/de/ch/11/aac/vorlesung/kap_2/kap2_6/kap26_7.vscml.html

  11. #11 Michael
    DE
    August 30, 2016

    Mittels einer Korrelation hat man m.E: einen Indikator, vielleicht eine Hypothese, aber eben keinen Beweis. https://www.tylervigen.com/spurious-correlations

  12. #12 Walter Orlov
    August 30, 2016

    Bleiben wir ernst, können wir uns dem direkten Nachweis von Gravitationswellen widmen. Als der Traum von deutlichen Signalen patzte, begannen die Forscher nach bestimmten Mustern im Rauschen der Detektoren zu suchen, bis schließlich welche wirklich gefunden wurden.

    Man hat eine der anerkanntesten Theorien, die die registrierten Signale als Folge der Auswirkung der Gravitationswellen von zwei verschmelzenden Schwarzen Löchern deutet.

    Anderseits wissen wir, zum Beispiel, dass die Spiegeln auf Drähten hängen, also faktisch die Pendel sind. Ja klar, bei so einem teuren Projekt kann man erwarten, dass alles ganz gut gedämpft ist. Aber fakt ist, dass in Detektoren die Pendel eingebaut sind. Und das allein schon macht mich misstrauisch.

    Ferner verhalten sich Gravitationswellen-Signale wie bei Kipperscheinung, vergleichen: https://walter-orlov.wg.am/gw-bild25.jpg , was selbstverständlich meinen Zweifel nur verstärkt.

    Darüber hinaus haben wir zwei Deutungsmöglichkeiten:

    Gravitationswellen aus Weltall (theoretisch belegt)

    Kipperscheinung irdischer Herkunft (Mangel der Konstruktion)

    Vorerst haben sich die Forscher für Gravitationswellen entschieden, denn sie danach eben gesucht haben. Nun warten wir ab.

  13. #13 schlappohr
    August 30, 2016

    Und die Resonanzfrequenz des Pendels liegt in der Nähe der Frequenz der gemessenen Gravitationswellen? Das ist Voraussetzung für die Sinnhaftigkeit der roten Pfeile. Das verstärkt nun wiederum meine Zweifel.

    Die Zweifel dürften spätestens beseitigt werden, wenn es ein zweites entferntes Interferometer gibt, das die Daten des ersten bestätigt.

  14. #14 Markus
    August 30, 2016

    @Schlappohr

    Das gab es ja. Die Signale wurden (in passendem zeitlichen Abstand) an den Interferometern in den Bundesstaaten Washinton und Louisiana gemessen (~3000km Abstand). Siehe z.B. hier:
    https://www.slate.com/content/dam/slate/blogs/bad_astronomy/2016/02/10/ligo_gravwave_detection.jpg.CROP.original-original.jpg

  15. #15 Walter Orlov
    August 31, 2016

    Unglücklicherweise waren zu zwei betroffenen Zeitpunkten nur diese zwei LIGO-Detektoren aktiv. GEO600 wurde gerade gewartet und die anderen befindet sich immer noch in Testphasen bzw. werden noch gebaut.

    Da die LIGO-Detektoren extra identisch gebaut wurden, ist es zu erwarten, dass sie gleich auf eine Störung – etwa, wenn irgendwo zwischen ihnen ein Blitz einschlägt – reagieren. Deswegen müssen wenigstens anders dimensionierte Detektoren mit anderen Eigenfrequenzen dabei sein.

  16. #16 Walter Orlov
    August 31, 2016

    Ferner sehe ich hier eine Herabstufung der Signifikanz solcher Beobachtungen dadurch, dass man das Rauschen der Detektoren durchwühlt, um etwas Verwertbares zu finden. D.h., man misst kein definiertes Signal, sondern rechnet ihn nach kompliziertem Verfahren aus. Ob dies noch als DIREKT gemessen betrachtet werden kann, ist aus meiner Sicht fraglich.

  17. #17 Jan
    August 31, 2016

    @Walter Orlov:
    Funktioniert ihr Navigationsgerät im Auto/Smartphone auch so gut wie meines? Ja? Dann schauen sie sich im Falle von GPS mal an, wie mit “komplizierten Verfahren” – ich nenne sie einfacher “Filtern” – ein verwertbares Messignal aus eigentlich für den Menschen nicht von zufälligem Rauschen unterscheidbaren Signalen gewonnen wird.

    Und warum funktioniert das? Weil genau das gemacht wird, was der Autor in seinem Artikel fordert: Eine zuvor erwartete Messgröße wird durch viele, viele Messungen bestätigt und gilt dadurch als nachgewiesen.
    Vielleicht hilft Ihnen das ja auch im Verständnis der Nachweise für die Relativitätstheorie, die Sie in Ihren Büchern so hanebüchen “widerlegen”.

  18. #18 Walter Orlov
    August 31, 2016

    @Jan

    Sie meinen wohl den Mittelwert. Ja, das wäre schon besser gewesen. Nun sind die Verschmelzungen von Schwarzen Löchern einmalige Ereignisse…

    Markus hat den Link schon gepostet. Schauen Sie die dritten (von oben) Diagrammen (“Residual”). Dies sind die Abweichungen, die von realen Kurven abgezogen wurden, damit sie sich den theoretischen Kurven erst recht ähneln. Inwiefern ist der Verlauf der Abweichungskurven nicht willkürlich?

    Wenn Sie aber einen Mittelwert aus mehreren Messungen ermitteln, dann verschwinden zufällige Abweichungen von selbst.

  19. #19 schlappohr
    August 31, 2016

    @Markus
    Wusste ich gar nicht… danke.

    @Walter Orlov

    Nun gut, die Signifikanz ist ein Maß für die Wahrscheinlichkeit, mit der eine Hypothese richtig ist. Die Signifikanz der LIGO-Ergebnisse ist groß genug, um damit die Hypothese der Gravitationswellen zu bestätigen. Das kann natürlich immernoch ein Irrtum sein. Aber ist sie auch groß genug , um deine Hypothese der Kippereignisse zu untermauern? Hast Du eigene Berechnungen dazu angestellt? Nochmal die Frage nach der Resonanzfrequenz der Pendel. Kennst Du sie? Und welches Ereignis kann weit (3000km) voneinander entfernte Pendel anregen? Kann ein Blitz das überhaupt? Falls ja, hat es denn zum richtigen Zeitpunkt und an der richtigen Stelle ein Gewitter gegeben? Und sieht eine gekippte Resonanzschwingung der Wellenform zum Verwechseln ähnlich, die die ART für einen Blackhole-Merger vorhersagt? Sind zudem die Bedingungen überhaupt erfüllt, um die Resonanz der Pendel zu verbiegen? Und würde eine Resonanzschwingung der Spiegel im Lasermessystem überhaupt die beobachteten Messergebnisse hervorrufen? Eine Menge offener Fragen.

  20. #20 Jan
    August 31, 2016

    @Walter Orlov:
    Der Mittelwert ist EIN Filterverfahren, noch dazu ein sehr einfaches. Natürlich gibt es auch deutlich fortgeschrittenere, die Ihnen hoffentlich bekannt sind.
    Ihre Antworten an schlappohr würden mich auch interessieren.

  21. #21 Struppi
    August 31, 2016

    Ich glaube nicht, dass es wirklich so pauschal ist, wie es der Artikel darstellt.
    Natürlich gibt es Studien die den zusammenhang von Genen und bestimmten Eigenschaften nachweisen. dazu werden bestimmte Genetische Merkmale oder zusammenhänge (Zwillinge) beobachtet und diese in eine Korrelation gesetzt. 100% ige Kausalität ergibt sich bei den Festellungen, wenn bestimmte Veränderungen an Genen immer zu bestimmten Verhalten führen.
    Bei statistischen Auffälligkeiten ist die Interpretation naturgemäß schwieriger und auch ich halte viele Studien von Soziologen für sehr fragwürdig, da oft eine spezifische Antwort gesucht wird, also die Schlussfolgerung im Grunde schon festeht.

    Bei den Nahrungsaufnahme Studien dürfte es ähnlich sein. Man möchte gerne etwas bewerben und denkt sich eine negative Wirkung aus, die dann gefunden wird. Letztlich müsste man wenn man seriös ist, einen Wirkmechanismus hypothetisieren, den dann andere Wissenschaftler evaluieren oder eben nicht.

    Das z.b. Zigaretten rauchen verantwortlich ist, für eine signifikate statistische Steigerung von Lungenkrebs dürfte unbestreitbar sein. Trotzdem bekomme nicht alle Raucher Lungenkrebs.
    aber waren das alles zweifelhafte Wissenschaftliche Studien, weil sie keine Kausalität untersuchten?

  22. #22 Walter Orlov
    August 31, 2016

    @schlappohr

    “Die Signifikanz der LIGO-Ergebnisse ist groß genug, um damit die Hypothese der Gravitationswellen zu bestätigen.”

    Wissen Sie wirklich, wie sie berechnet wurde?

    Sonst stellen Sie die Fragen… Ich habe den Eindruck, dass Sie wenig praktische Erfahrung haben. Sie reden von den Sachen, die eigentlich nur die Betreiber der Anlage kennen können. Sie werden nicht öffentlich gemacht.

    Aber falls ich nötige Daten hätte, könnte ich selbstverständlich die Rechnung machen.

  23. #23 Joseph Kuhn
    August 31, 2016

    @ Schlappohr:

    “die Signifikanz ist ein Maß für die Wahrscheinlichkeit, mit der eine Hypothese richtig ist.”

    So wird das oft gelesen, aber das ist eigentlich nicht ganz korrekt. Als “signifikant” gilt ein Ergebnis mit einem p-Wert unterhalb einer festgelegten Signifikanzschwelle. Der p-Wert gibt an, mit welcher Wahrscheinlichkeit das beobachtete Ergebnis durch Zufall eingetreten wäre. Eine Hypothese ist entweder richtig oder falsch.

    @ Struppi:

    “weil sie keine Kausalität untersuchten?”

    Epidemiologische Beobachtungsstudien können zwar nicht direkt Kausalität untersuchen, aber es gibt zur Kanzerogenität der Inhaltsstoffe des Tabaks z.B. auch toxikologische Studien. Zur kausalen Interpretation in der Epidemiologie siehe ansonsten auch die Bradford-Hill-Kriterien.

  24. #24 Jan
    August 31, 2016

    Wenn ich mich nicht verlesen habe, hat Schlappohr auch ganz konkret nach der von Ihnen, Herr Orlov, postulierten Alternative gefragt und Details dazu wissen wollen. Aus meiner Erfahrung spricht so etwas schon eher für praktische Erfahrung als ein durchschaubares Ausweichen wie in Ihrer Antwort darauf.

  25. #25 Walter Orlov
    August 31, 2016

    @Joseph Kuhn => @ Schlappohr

    Vielleicht noch eine kleine Bemerkung: In diesem Fall wurde mit 5-Sigma das Signal selbst “nachgewiesen”. Nun, man geht davon aus, dass dessen Ursache die Gravitationswellen sein sollen.

  26. #26 Walter Orlov
    August 31, 2016

    @Jan

    Wenn Sie es so meinen… Übrigens, wie steht es mit meiner Frage: “Inwiefern ist der Verlauf der Abweichungskurven nicht willkürlich?” – Sind sie gemessen wurden oder festgelegt (postuliert)?

  27. #27 schlappohr
    August 31, 2016

    @Walter Orlov

    “Wissen Sie wirklich, wie sie berechnet wurde? ”

    Nein, aber sie wurde von Leuten berechnet, die das sehr genau wissen. Und ich habe allen Grund, ihnen zu vertrauen.

    “Sonst stellen Sie die Fragen… ”

    Fragen stellen ist das Wichtigste, was ein Wissenschaftler tun kann, oder?

    “Ich habe den Eindruck, dass Sie wenig praktische Erfahrung haben.”

    Bei Hochpräzisionslaserinterferometern haben sie vollkommen recht.

    “Sie reden von den Sachen, die eigentlich nur die Betreiber der Anlage kennen können. ”

    Aber sollte man über diese Dinge nicht sehr genau Bescheid wissen, bevor man die Vermutung äußert, die Anlage könnte falsche Messwerte liefern?

  28. #28 schlappohr
    August 31, 2016

    @Joseph Kuhn

    Ja, korrekt. Aber wenn die Analyse vermuten lässt, dass ein Messergebnis kein Zufall ist, dann ist das eine Untermauerung für eine Hypothese, die den gemessenen Effekt zur erklären versucht. Eine Hypothese ist ja zunächst einmal eine Annahme, deren Wahrheitsgehalt man nicht kennt. Um eine Hypothese experimentell zu untermauern, muss man aus dem Datenwust die gesuchten Signale herausfiltern und nachweisen, dass sie mit hoher Wahrscheinlichkeit kein Zufallsartefakt sind.

  29. #29 Hav0k
    August 31, 2016

    Lieber Herr Orlov,
    da Sie sich ja offenbar wirklich für LIGO interessieren, aber zum wiederholten Male Opfer einer großangelegten Verschwörung skrupelloser Wissenschaftler wurden, muss ich hier einschreiten. Psssst, ich hab hier was für Sie:

    https://github.com/minrk/ligo-binder/blob/master/GW150914_tutorial.ipynb

    Damit können Sie genau nachvollziehen, wie das LIGO Signal aus dem Rauschen extrahiert wurde. Die statistische Signifikanz können Sie dann selbstständig ermitteln, das gehört ja schließlich zu Ihren leichtesten Übungen.

    Noch eins: verraten Sie niemandem, dass Sie diese Informationen von mir haben. Wissenschaftler sind gnadenlos gegenüber Whistleblowern – ich muss sonst um Leib und Leben fürchten.

  30. #30 Dr. Webbaer
    August 31, 2016

    Erst die Theorie

    So in etwa (und nicht andersherum, insofern dürfte es rein mit statistischen Mitteln schwer fallen auch beim sog. Machine-Learning Erkenntnis zu entwickeln oder Evidenz zu sammeln).
    Korrelation (mit einem möglichst hohen Faktor) sozusagen als notwendige Voraussetzung von sog. Kausation…

  31. #31 Joseph Kuhn
    August 31, 2016

    “Erst die Theorie …”

    Und manchmal doch auch andersherum?
    https://www.wired.com/2008/06/pb-theory/

  32. #32 Dr. Webbaer
    August 31, 2016

    Darauf ist angespielt worden, Herr Dr. Kuhn.
    BTW, dies hier:

    die Signifikanz ist ein Maß für die Wahrscheinlichkeit, mit der eine Hypothese richtig ist (Kommentatorenkollege “Schlapp”)

    So wird das oft gelesen, aber das ist eigentlich nicht ganz korrekt.

    …war natürlich zu korrigieren.
    MFG
    Dr. Webbaer

  33. #33 Walter Orlov
    August 31, 2016

    @Hav0k

    So viel Mühe (einen Link hierher zu kopieren) bräuchten Sie nun wirklich nicht zu machen. Ich glaube Ihnen aufs Wort, dass es mit modernen, ausgeklügelten Datenverarbeitungsmethoden geht, am Ende das zu kriegen, was die Forscher eben präsentiert haben.

    Das Problem sehe ich aber darin, dass diese Bearbeitung das Aussehen ursprünglicher Messungen so gravierend ändert, dass diese schwer wiederzuerkennen sind. Ich vermisse quasi die Plausibilität: Am Ende bekomme ich nicht dassele, was ich im Anfang hatte.

    Wäre die Amplitude des Nutzsignals mehrfach größer als Amplitude des Rauschens gewesen, hätte ich mit Wiedererkennung kein Problem gehabt. Auf diese Weise könnte ich wirklich an einen direkten Nachweis denken.

  34. #34 Uli Schoppe
    August 31, 2016

    @Walter : Du wolltest aber doch vorrechnen wenn Du was hast. Man gibt Dir die Gelegenheit und Du redest Dich raus? Jetzt aber Zahlen bitte…

  35. #35 Walter Orlov
    September 1, 2016

    @Uli Schoppe

    Es sind die falschen Daten. Wo sind die Massen der Spiegeln; Länge, Querschnitt und Elastizitätsmodul der Drähte? Wenigstens das. Können Sie das mir liefern? Wir können dann zusammen die Eigenfrequenzen von Pendeln ausrechnen. Das ist kein Hexenwerk.

  36. #36 Jan
    September 1, 2016

    @Walter:

    Wo sind denn die Nachweise für Ihre Behauptung, nämlich dass das detektierte Signal aus einer Kippung resultiert? Berechnungen, Daten, Vergleiche? Ich sehe da nur ein Bild mit Pfeilen, aber ohne Skaleneinheiten, mit denen sich ein echter Vergleich anstellen lassen könnte.
    Und übrigens finden sie alle, wirklich alle, Daten zur LIGO-Messung in dem Link von Hav0k. Und zusätzlich die Algorithmen, mit denen sie dann gefiltert wurden. Transparenter geht es nicht.

  37. #37 Walter Orlov
    September 1, 2016

    Eigentlich darf der Beweis rein praktischer Natur sein. Ich kann (bedingt) akzeptieren, dass das Signal mit 5.1 Sigma belegt ist (und darum geht es auf gelobter Webseite). Wie kann man aber beweisen, welche Ursache es hat?

    LIGO wurde allein für die Registrierung von Gravitationswellen gebaut. Also sollen logischerweise die Gravitationswellen die Ursache sein… falls ja andere Quellen ausgeschlossen sind.

    Jetzt schauen wir uns das Ergebnis (“aLIGO FILTERED strain data near GW150914”) noch einmal an. Links und rechts bei H1 und L1 strains sehen wir die Schwingungen der Anlagen vor und nach Ereignis. Überraschenderweise weisen sie ungefähr gleiche Periode wie beim Aufschwung auf. Sind dies nicht die Eigenschwingungen der Detektoren? Ich denke doch.

    Wenn es ruhig ist, schwingt die Anlage mit Eigenfrequenz, aber mit kleiner Amplitude (denn die Frequenz bestimmt extra gedämpft wird) vor sich hin. Danach kommt aber eine kurze Störung (etwa von Dauer eines Blitzes), als Folge gerät die Anlage aus dem Gleichgewicht, was schließlich in Kipperscheinung endet. So könnte es gewesen sein.

    Klar, das ist kein Beweis. Beweisen kann man, wie gesagt, nur praktisch. Z.B., ein Praktikant soll auf Zehenspitzen mit einem Hämmerchen rumlaufen und alles anklopfen, was ihm im Weg steht. Gleichzeitig sollen die Messungen gemacht und genauso wie vorher bearbeitet werden. Wenn wieder die Signale wie von Gravitationswellen auftauchen, dann… wissen die Forscher Bescheid 😉

  38. #38 Jan
    September 1, 2016

    @Walter:
    Vielleicht erinnere ich mich nur falsch, aber hat man nicht schon zwei solcher Ereignisse aufgezeichnet?

  39. #39 Walter Orlov
    September 1, 2016

    Und sogar drei… Und?

  40. #40 Dr. Webbaer
    September 1, 2016

    Signifikanz leidet natürlich insgesamt am (extra-extra-niedrigen – und derart üblicherweise definierten (!)) Signifikanz-Niveau von sage und schreibe:

    5 %.

    In der Naturlehre wird insofern mit Niveaus wie diesen gearbeitet:
    -> https://de.wikipedia.org/wiki/Six_Sigma

    Was im Gesellschaftlich-“Wissenschaftlchen” idR nicht geht, weil “zu teuer”.
    Die Zahl der Probanden würde dann nicht mehr sozusagen “in die Garage passen”, oder wäre kaum zu finanzieren.
    Egal wie viele “dicke Studies” bereit stehen.

    Auch insofern vertraut der Schreiber dieser Zeilen, der sich nach einziger Arbeit von der Wissenschaft vor la-anger Zeit verabschiedet hat, zuvörderst Naturlehrern.

    MFG
    Dr. Webbaer

  41. […] Quantenphysiker Dr. Florian Aigner von den Wiener Skeptikern gibt in seinem Science-Blog Na klar! Nachhilfe in […]

  42. […] signifikant – wissenschaftlich belanglos, na klar am 29. August […]

  43. #43 Laie
    September 7, 2016

    Werden zu oft Parameter weggelassen, so wirds ungenau. Wie y~f(x) statt y~f(x1,x2,….xn)

    Sagen wir x1=”die Person spielt viele Gewaltspiele, Egoshooter”. Und y wäre “die Person macht das Egoshooten dann auch in der Realität mal”.

    Man muss auch die anderen Parameter kennen, und ggf. empirische Untersuchungen auf weitere Parameter … erweitern, ohne für alle Einzelfälle – jedoch über eine große Summe von einzelnen – eine Aussage treffen zu können.

  44. #44 Aginor
    September 8, 2016

    Nur so am Rande, ich finde diese beiden Comics illustrieren das ganze schön eingängig 😉 :

    https://xkcd.com/1725/
    und
    https://xkcd.com/552/