In unserer Diskussion neulich zum Thema des “Erhabenen” ging es nebenbei auch kurz um Karl Popper und sein wissenschaftstheoretisches Konzept der Falsifizierbarkeit. Ich hatte dort kurz angeführt, dass das Konzept philosophisch als überholt gilt, das aber nicht weiter ausgeführt. Ich nehme ds aber mal zum Anlass, etwas über Falsifizierbarkeit nachzudenken.
Nun bin ich – mit lediglich ein paar Semestern Philosophie als geplantes Nebenfach, so kurz nach der letzten Eiszeit – sicherlich keine belesene Philosophie-Expertin (und ich gebe zu, dass ich mich auch gern schnell mal bei Wikipedia schlau lese, was diese oder jene Philosophin so gesagt hat). Wer also hier eine Analyse der Popperschen Idee der Falsifizierbarkeit im Lichte der Feyerabendschen Ideen unter besonderer Berücksichtigung von Poincares Wissenschaftstheorie oder etwas Ähnliches erwartet, wird leider enttäuscht werden. (Womit ich nicht sage, dass so eine Analyse uninteressant oder nutzlos wäre – es geht hier nicht um Philosophie-bashing (im Gegenteil), sondern darum, zu sehen, dass ein philosophisch umstrittenes Konzept im Alltag durchaus nützlich sein kann.)
Die Idee der Falsifizierbarkeit ist ja erst einmal recht einfach: Man soll Theorien und Hypothesen so aufstellen und formulieren, dass sie sich auch auf irgendeine Weise widerlegen lassen. Nur Experimente (oder andere Untersuchungen), die dies zumindest prinzipiell leisten können, können als eine Überprüfung der Hypothese angesehen werden.
Die Idee dahinter hat Brecht im Stück “Leben des Galilei” sehr schön zusammengefasst (es geht um die Beobachtung der Sonnenflecken):
Meine Absicht ist nicht, zu beweisen, daß ich bisher recht gehabt habe, sondern: herauszufinden, ob. Ich sage: laßt alle Hoffnung fahren, ihr, die ihr in die Beobachtung eintretet. Vielleicht sind es Dünste, vielleicht sind es Flecken, aber bevor wir Flecken annehmen, welche uns gelegen kämen, wollen wir lieber annehmen, daß es Fischschwänze sind. Ja, wir werden alles, alles noch einmal in Frage stellen. Und wir werden nicht mit Siebenmeilenstiefeln vorwärtsgehen, sondern im Schneckentempo. Und was wir heute finden, werden wir morgen von der Tafel streichen und erst wieder anschreiben, wenn wir es noch einmal gefunden haben. Und was wir zu finden wünschen, das werden wir, gefunden, mit besonderem Mißtrauen ansehen. Also werden wir an die Beobachtung der Sonne herangehen mit dem unerbittlichen Entschluß, den S t i l l s t a n d der Erde nachzuweisen! Und erst wenn wir gescheitert sind, vollständig und hoffnungslos geschlagen und unsere Wunden leckend, in traurigster Verfassung, werden wir zu fragen anfangen, ob wir nicht doch recht gehabt haben und die Erde sich dreht!
Soweit die Idee. Aber auch ohne vertiefte Kenntnis der philosophischen Literatur kann man leicht einsehen, dass das mit der Falsifizierbarkeit nicht immer so leicht ist, wie es auf den ersten Blick aussieht.
Natürlich gibt es manche Theorien, die prinzipiell unwiderlegbar sind – um die müssen wir uns tatsächlich nicht kümmern. Wen ich zum Beispiel behaupte, dass das Universum in Wahrheit vor drei Minuten erschaffen wurde, aber mit allen Bestandteilen eben genau da, wo sie vor drei Minuten waren (einschließlich unserer Erinnerungen etc.), dann lässt sich dieses Universum in keiner Weise von unserem unterscheiden. Die Behauptung ist also unwiderlegbar. Solche Theorien sind also eindeutig nicht wissenschaftlich.
Schwieriger wird es bei Theorien, die tatsächlich konkrete Vorhersagen machen. Ein einzelne Beobachtung, die einer solchen Theorie widerspricht, lässt sich oft mit Hilfe von Zusatzannahmen erklären. Ein Beispiel hierfür ist die Entdeckung der Konstanz der Lichtgeschwindigkeit, unabhängig von der Orientierung des Messaufbaus auf der Erde. Dies widersprach der damals (so um 1880) vorherrschenden Theorie, nach der sich Licht ähnlich wie eine Schallwelle in einem Äther ausbreitet. Die Theorie wurde damals aber nicht sofort verworfen – vielmehr überlegte man, ob es nicht andere Erklärungen geben könnte, beispielsweise, dass die Erde den Äther mit sich mitzieht, so dass Objekte auf der Erde immer relativ zum Äther ruhen. (Ein anderes – allerdings teilweise fiktives – Beispiel findet ihr hier.) Ein noch anderes Beispiel ist Hahnemanns lange Liste all der Dinge, die Homöopathie unwirksam machen sollen – hier kann man ahnen, wie bei jeder misslungenen Behandlung ein weiteres Element zur Liste hinzugefügt wurde.
Analysiert man empirisch, wie sich neue Theorien durchgesetzt haben, so ist auch da das Poppersche Falsifikations-Kriterium nicht immer erfüllt – neue Theorien stehen oft auch mit einigen Experimenten in Widerspruch, was oft daran liegt, dass in einer ersten Theorie noch nicht alle Effekte enthalten sind. In der Anfangszeit der Quantenmechanik konnte man beispielsweise zwar die Spektrallinien des Wasserstoff-Atoms erklären, nicht aber deren Aufspaltung in der sogenannten Feinstruktur (ich verweise auf die englische Seite, weil die deutlich ausführlicher ist). Erst als man auch relativistische und andere Effekte berücksichtigte, ließen sich die Spektrallinien im Detail verstehen. Streng genommen war damit nach Popper die Quantenmechanik in ihrer Anfangszeit genau so falsifiziert wie das alte Bohrsche Atommodell – es gab Beobachtungen, die der Theorie widersprachen, das sollte es eigentlich gewesen sein.
Ähnlich war es mit der Newtonschen Mechanik – auch die besten Berechnungen des 19. Jahrhunderts konnten die berühmte Periheldrehung des Merkur nicht vollständig erklären. (In vielen populärwissenschaftlichen Büchern steht, dass es nach Newton gar keine Periheldrehung geben dürfte, das ist aber falsch, weil der Einfluss der anderen Planeten eine Rolle spielt. Nur ein Teil der Periheldrehung kommt durch Effekte der Allgemeinen Relativitätstheorie zu Stande.) Natürlich suchte man aktiv nach Erklärungen (beispielsweise dem Planeten Vulkan), aber niemand kam auf die Idee, wegen dieser Unstimmigkeit gleich die ganze Theorie zu entsorgen.
Und das ist auch ganz richtig so. Eine Theorie ist um so besser, je mehr Beobachtungen sie mit möglichst wenig Annahmen erklären kann. Ein simples richtig-falsch ist gerade in der Physik nicht angemessen, und auch heute rechnen wir die meisten Probleme ohne Skrupel mit der falschen Newtonschen Theorie.
Wikipedia schreibt zur Kritik an Popper
In beiden Bereichen [Wissenschaftstheorie und Praxis] bestehen nach wie vor induktivistisch-empirizistische Bestätigungspositionen, heute gemeinhin mit bayesianistischen Wahrscheinlichkeitstheorien der Induktion verbunden, die allerdings häufig in der Terminologie Poppers umformuliert vertreten werden.
In dem Verweis auf Bayes kommt mathematisch das zum Ausdruck, was ich eben schon gesagt habe: Eine Theorie, die durch zahlreiche Beobachtungen gut bestätigt ist, wird durch einzelne unerklärbare Phänomene nicht gleich widerlegt – es ist wahrscheinlicher, dass das unerklärte Phänomen doch noch eine plausible Erklärung findet als dass gleich die ganze Theorie Mist ist. (Trotzdem wird natürlich aktiv nach der Erklärung ungelöster Fragen gesucht, wie beispielsweise bei der berühmten Pioneer-Anomalie, die lange zeit Rätsel aufgab.)
Ihr seht also, dass das strikte Poppersche Kriterium “Eine Beobachtung, die der Theorie widerspricht, macht die Theorie zunichte” nicht unbedingt so einfach umzusetzen ist. Wendet man das Poppersche Kriterium auf sich selbst an (was natürlich problematisch ist, weil die Philosophie selbst keine empirische Wissenschaft ist), dann ist das Kriterium also falsifiziert.
Aber: Wissenschaft besteht ja vor allem in der täglichen Arbeit im Labor oder am Computer. Und da leistet die Idee der Falsifikation manchmal durchaus gute Dienste. Jürgen hat neulich ja auch gezeigt, wie sehr wir dazu neigen, unsere Ideen lieber zu bestätigen als zu widerlegen. Und um sich davor zu schützen, ist es hilfreich, die Idee der Falsifizierbarkeit immer im Hinterkopf zu haben.
Statt also noch weiter theoretisch zu überlegen, was es mit der Falsifizierbarkeit auf sich hat, schauen wir einfach mal ein paar Beispiele aus meiner täglichen Forschungspraxis an und gucken, in wie weit sich das Konzept “Falsifizierbarkeit” hier niederschlägt. (Dabei ist natürlich extreme Vorsicht geboten: Ich analysiere hier meine eigenen Denkprozesse, zum Teil auch solche, die schon länger zurückliegen – es ist also durchaus möglich, dass ich hier einer gewissen Selbsttäuschung unterliege.)
Vor etwas mehr als 10 Jahren habe ich mich ziemlich intensiv mit der Simulation von Spanprozessen beschäftigt, also der Frage, was in einem Werkstoff passiert, wenn man ihn bohrt, fräst oder dreht (nein, nicht einfach rumdrehen, sondern Drehen auf einer Drehbank und dabei mit einem Werkzeug Material abheben). Mich interessierten – ich kann meine Herkunft als Theoretikerin eben nicht leugnen – vor allem grundlegende Fragen: Welche Materialeigenschaften haben welchen Einfluss auf den Prozess. Irgendwann fiel mir auf, dass man in der Literatur nichts zu der Frage findet, wie genau die Wärmeausdehnung eigentlich so einen Prozess beeinflusst – immerhin werden die Materialien ganz schön warm, da schien es mir auf den ersten Blick plausibel, dass eine ungleichmäßige Wärmeausdehnung Spannungen erzeugt, die auch den Prozess beeinflussen. Vor allem war es so, dass in meinen Simulationen die entstehenden Späne deutlich stärker gekrümmt waren als man das im Experiment beobachtet – andere Simulationen in der Literatur zeigten ein ähnliches Phänomen. Konnte das an der Wärmeausdehnung liegen?
Das Schöne an Computersimulationen ist ja, dass man so etwas leicht überprüfen kann – in einem Experiment kann man die Wärmeausdehnung eines Materials nicht mal eben schnell an- oder ausknipsen, in der Simulation aber schon. Und siehe da – egal ob ich die Ausdehnung ein- oder ausschaltete, die Späne sahen am Ende nahezu gleich aus. Wäre das nicht der Fall gewesen, hätte ich jetzt eine interessante Arbeitshypothese gehabt (die Spanbildung hängt auch von der Wärmeausdehnung ab) – aber so war es eben nicht. Idee falsifiziert, und dann lieber andere Dinge angeguckt.
Aber so ganz einfach ist es mit dem Falsifizieren nicht immer, wie man an diesem Beispiel hier sieht: Ich simuliere mal wieder die Spannung in Wärmedämmschichten und überlege, welchen Einfluss zum Beispiel die Festigkeit eines der beteiligten Materialien haben sollte. Wie immer bei solchen Simulationen ist es sinnvoll, sich erst mal zu fragen, was man erwartet. Ich überlege also zum Beispiel “Aha, wenn man die Festigkeit der Haftvermittlerschicht herabsetzt, sollte sie die darüberliegende Wärmedämmschicht weniger unter Spannung setzen, also sollte deren Spannung abnehmen.” Dann stelle ich fest, dass das – zumindest in bestimmten Situationen- nicht so ist. Meine Idee ist damit falsifiziert.
Oder auch nicht? Natürlich ist es immer eine gute Idee, zu verstehen, warum die eigene Intuition in die Irre gegangen ist – ich habe mir also die verschiedenen Rechnungen nochmal genau angeguckt und im Detail ausgewertet. Ich hatte übersehen, dass es noch eine weitere Schicht gibt, deren Spannungen der Haftvermittlerschicht entgegenwirken. Wenn diese weitere Schicht hinreichend dick ist, dann erzeugt sie große Spannungen – eine Haftvermittlerschicht mit höherer Festigkeit kann dem mehr entgegensetzen und reduziert die Spannungen deshalb wieder.
Meine ursprüngliche Idee war also richtig, aber sie galt eben nur in bestimmten Fällen. Habe ich die Idee jetzt falsifiziert oder verifiziert? Immerhin brauchte ich eine zusätzliche Überlegung, die ich auf die alte Hypothese draufsatteln musste, um sie zu retten – ist das nicht eigentlich etwas, das man nicht tun sollte (widerlegte Hypothesen durch Zusatzüberlegungen retten, statt sie aufzugeben)? Offensichtlich nicht – denn die beiden Ideen fügten sich nahtlos zusammen – jedes der Materialien hat einen Einfluss auf die Wärmedämmschicht, die beiden Einflüsse sind entgegengesetzt und die jeweilige Schichtdicke entscheidet, wer gewinnt.
So etwas passiert oft: Eine ursprüngliche Idee wird durch Überprüfen streng genommen falsifiziert, wird aber durch zusätzliche Argumente und Überlegungen doch noch gerettet. Das ist dann in Ordnung, wenn man nicht für jede neue Beobachtung eine neue Hypothese dazupacken muss (so wie bei Hahnemann), sondern das ganze sich im Rahmen hält. Wenn ich für jede Spannungssimulation neue oder andere Argumente brauche, um die Beobachtung an meine Hypothese anzupassen, dann taugt das natürlich wenig – wenn ich aber mit einigen wenigen Annahmen, die sich erst in ihrer Gesamtheit entwickeln müssen, am Ende eine große Zahl von Beobachtungen erklären kann, dann ist es durchaus in Ordnung, dass ich zwischendurch zu einfache Hypothesen hatte, die als Gesamterklärung nicht ausreichen und widerlegt wurden, die aber als Bestandteil der Erklärung dazugehören. (Anders als beim Entwickeln fundamental neuer Theorien habe ich natürlich hier den Vorteil, dass der generelle theoretische Rahmen, in dem ich mich bewege, gut bekannt und erforscht ist.)
Generell sollen wir ja auch unsere Überlegungen so planen, dass wir versuchen, unsere Hypothese zu widerlegen. Aber nicht immer ist die Grenze zwischen Falsifizieren wollen und bestätigen wollen klar: Diesen Sommer habe ich mit einer Kollegin (ja, generisches Femininum) zusammen eine Idee entwickelt, wie man die mikroskopische Struktur einer mit einem speziellen Verfahren hergestellten Schicht erklären kann. Mit etwas Überlegung und Dank fleißiger Literaturrecherche (die nicht ich gemacht habe, muahaha), fanden wir eine mögliche Erklärung, die für einen Teil der Strukturen funktionierte und insbesondere erklären konnte, warum wir dort eine dreizählige Symmetrie beobachteten. Das allein ist natürlich allenfalls ne Hypothese – jetzt ging es darum, die zu überprüfen.
Unter anderen Herstellparametern sah die Schicht anders aus, er ergab sich dann nämlich eine vierzählige Symmetrie. Mit Hilfe einer Messung für die Kristallorientierung ergab sich diese vierzählige Symmetrie direkt aus unserer Überlegung. Zusätzlich konnte unsere Überlegung etwas über die Winkel in dieser Struktur vorhersagen (die wir bisher nicht so genau angeguckt hatten) – quantitativ messen lassen sich die zwar nur schwer, aber qualitativ passten auch die Winkel zu dem, was wir uns überlegt haben.
Hier kann man jetzt streiten, ob wir wirklich eine echte Falsifizierung versucht haben. Hätte es bei der vierzähligen Symmetrie nicht gepasst, hätten wir unsere Theorie ja nicht unbedingt gleich verworfen, sondern wohl auch eine Begründung gesucht, warum der Mechanismus nur bei bestimmten Bedingungen so abläuft, bei anderen nicht. (Das wäre natürlich möglich, die Welt ist ja nicht immer einfach…) War das nun echte Falsifizierung? Oder eher ein Versuch, eine Theorie zu bestätigen? Schwer zu entscheiden – immerhin war die Überprüfung der zweiten Struktur geeignet, den Gültigkeitsbereich der Theorie, die wir für die Schichtbildung hatten, einzuschränken. Konzeptionell hilft der Gedanke “Hmm, wenn das jetzt nicht passt, dann hat unsere Idee ein Problem” auf jeden Fall weiter, um schnell zu sehen, an welcher Stelle man gucken muss.
Auch beim Planen der Forschung hilft die Idee der Falsifikation durchaus weiter – leider fällt mir gerade kein passendes Beispiel aus meiner eigenen Praxis ein, deswegen halte ich es hier mal allgemein. Wenn wir nach aktueller Arbeitshypothese erwarten, dass unter einer bestimmten Versuchsbedingung X passiert, dann ist es immer gut, sich schon vorher zu fragen: “Was würde ich tun, wenn ich nicht X beobachte, sondern etwas anderes? Würde ich das als Problem oder Widerlegung meiner Arbeitshypothese betrachten, oder könnte ich das auch im Rahmen meiner Hypothese problemlos erklären?” Und falls letzteres der Fall ist, dann kann man sich das Experiment möglicherweise gleich sparen und lieber etwas anderes tun.
An diesen Beispielen aus dem Forschungsalltag sieht man vor allem eins: Die Trennung zwischen Falsifikation und dem Versuch, eine Theorie zu bestätigen, ist nicht so scharf, wie man vielleicht rein theoretisch denken könnte. Manchmal reicht ein Ergebnis aus, um mich davon zu überzeugen, dass eine Idee nichts taugt (wie die mit der Wärmeleitung bei der Zerspanung), manchmal führt die Falsifikation dazu, dass man seine anfängliche Hypothese erweitern und zusätzliche Annahmen einführen muss, manchmal klappt auch alles, die Falsifikation scheitert – mit anderen Worten, die Hypothese wird erst einmal bestätigt. (So wie Gelilei es im Theaterstück – wirklich etwas theatralisch – ausgedrückt hat.)
Wenn wir noch einmal auf den Satz oben von Wikipedia zurückkommen – habe ich nun echt falsifiziert (bzw. es versucht)? Oder habe ich eher induktiv-empiristisch bestätigt und lediglich (im Sinne von Bayes Wahrscheinlichkeitstheorem) die Wahrscheinlichkeit angepasst, mit der ich eine Hypothese für wahr halte?
Ehrlich gesagt tue ich mich schwer mit dieser Frage. Empirisch ist sie kaum zu beantworten, weil die Grenzen ja letztlich fließend sind – wann ist eine Theorie so unwahrscheinlich geworden oder braucht so viele weitere Annahmen, dass sie als falsifiziert gelten kann? Und – noch schwieriger – wie sollte man empirisch herausfinden, was tatsächlich in mir vorging und welche Gedanken ich genau verfolgt habe?
Auch introspektiv lässt sich die Frage kaum klären – ganz abgesehen davon, dass das natürlich eine rein subjektive Selbstwahrnehmung ist. Ich denke oft an das Konzept “Falsifikation”, gerade wenn ich neue Experimente oder Simulationen plane, um eine Hypothese auf den Prüfstand zu stellen. Aber ob ich da eigentlich doch bestätigen will und das Ganze nur nach Popper umformuliere, so wie es bei Wiki steht, oder ob ich wirklich zu falsifizieren versuche – wie will man das entscheiden? Vermutlich ist sogar beides richtig – immerhin ist unser Bewusstsein und Verstand kein monolithischer Block, sondern besteht aus unterschiedlichen und widerstreitenden Aspekten (oft “Agenten” genannt, was aber nix mit Geheimdiensten zu tun hat). Gut möglich also, dass es da den Falsifizierungs-Agenten gibt, der gern Dinge kaputtmacht (und eigentlich liebe ich es, argumentativ Dinge zu zerlegen), und auch den Bestätigungs-Agenten, der an meiner aktuellen Hypothese hängt und diese gern untermauert sehen würde.
Wissenschaft, das darf man nie vergessen, wird von Menschen gemacht – und die haben widerstreitende Gefühle und sind sich über die Hintergründe ihrer Gedanken oft selbst nicht im Klaren. Insofern ist es dann auch nicht verwunderlich, dass die Frage “Falsifizieren oder Bestätigen” sich nicht eindeutig klären lässt.
Klar ist aber, dass das Konzept der Falsifizierung nützlich ist – schlicht deswegen, weil es in einem Wort eine Überlegung auf den Punkt bringt und einen daran erinnert, dass man immer kritisch prüfen muss, ob man die aktuelle Lieblingshypothese gerade wirklich ernsthaft prüft oder sich eher nur bestätigend auf die Schulter klopfen will, ohne es ernst mit der Überprüfung zu meinen. So berechtigt die philosophische Kritik an Popper also auch sein mag – praxistauglich ist seine Idee auf jeden Fall. Und auch wenn gute Wissenschaftlerinnen sicher auch vor Popper versucht haben, ihre Überlegungen zu falsifizieren, gebührt Popper doch der Verdienst, das Konzept sauber formuliert und auf den Punkt gebracht zu haben.
Kommentare (25)