Im Journal of Clinical Epidemiology wird gerade ein Streit um das Verhältnis zwischen der Praxisnähe von Studien und ihrer methodischen Stringenz ausgetragen, genauer formuliert, ob eine hohe interne Validität von Studien immer (und notwendigerweise) auf Kosten der externen Validität geht und umgekehrt.
Bei der „internen Validität“ von Studien geht es darum, inwiefern sie es durch ihr Design ermöglichen, den spezifischen Einfluss eines Faktors auf das Outcome getrennt von anderen Einflussfaktoren zu untersuchen. In pharmakologischen Studien sind RCTs der Goldstandard, weil sich Interventions- und Kontrollgruppe im Idealfall nur hinsichtlich der Intervention unterscheiden und andere Einflussfaktoren durch die Randomisierung zufällig auf die Vergleichsgruppen verteilt sind. Bei der „externen Validität“ geht es dagegen darum, inwiefern sich die in einem spezifischen Kontext gewonnenen Erkenntnisse auf andere Kontexte übertragen lassen, also wie verallgemeinerungsfähig die gefundenen Zusammenhänge sind.
RCTs sind nicht immer möglich, z.B. wenn eine Intervention aus ethischen Gründen nicht experimentell veranlasst werden soll – wir hatten gerade die Diskussion um gruppennützige Arzneimittelprüfungen an Demenzkranken, oder wenn eine zufällige Zuweisung zur Interventions- oder Kontrollgruppe aus rechtlichen Gründen nicht zulässig ist (weil die methodisch geforderte Ungleichbehandlung von Interventions- und Kontrollgruppe verboten ist), oder aus rekrutierungsorganisatorischen Gründen, z.B. weil man nicht genug Probanden bzw. Untersuchungseinheiten findet, die man randomisieren kann. Letzteres kann bei komplexen Interventionen auf Gemeindeebene oder Länderebene der Fall sein. Dann müssen Wirksamkeitsnachweise anders geführt werden.
In einem Artikel im Journal of Clinical Epidemiology (2015; 68: 1251-60) hatten Walach und Loef im letzten Jahr dafür plädiert, Studiendesigns mit geringerer interner Validität, z.B. Fallstudien, auch grundsätzlich in die Evidenzsynthese einzubeziehen und gelten zu lassen. Walach knüpft damit an seine schon früher formulierte Kritik an hierarchischen Evidenzmodellen an. Auf seiner Internetseite hat er den Artikel im Journal of Clinical Epidemiology bereits vor einiger Zeit vorgestellt. Er begründet seine Forderung, auf hierarchische Evidenzmodelle zu verzichten, damit, dass hohe interne Validität stets nur im Rahmen künstlicher Forschungskontexte, durch Abstraktion von der bunten Realität, also auf Kosten der externen Validität zu erreichen sei:
„Der Punkt unseres Argumentes ist nun: interne und externe Validität sind nicht miteinander kompatibel; sie schließen sich in gewisser Weise aus. Jede Studie, die die interne Validität erhöht, verringert die externe Validität, und umgekehrt. Es ist keine Studie denkbar, und zwar aus prinzipiellen Gründen, die beides, externe und interne Validität gemeinsam erhöht, und ich habe auch faktisch noch keine gesehen, bei der das der Fall wäre.“ (Kursivsetzungen im Original)
Dagegen wendet sich nun Jürgen Windeler, Chef des IQWIG, in einem Kommentar im Journal of Clinical Epidemiology (2016; 75: 127-28): Es gebe keine gegenläufige Hierarchie von interner und externer Validität. Viele RCTs hätten einen hohe externe Validität und umgekehrt wären z.B. Fallstudien aus einer europäischen Klinik wohl kaum relevant für das indische Gesundheitssystem (ebda. S. 128), d.h. sie haben nicht per se eine höhere externe Evidenz. Interne und externe Validität hätten vom Konzept her nichts miteinander zu tun und könnten daher auch nicht in einem reziproken Verhältnis zueinander stehen. Walach hat darauf in der gleichen Ausgabe noch einmal geantwortet (2016; 75: 128-29) und bestreitet, dass man „Inhalt“ und „Kontext“ trennen könne (und somit interne und externe Validität) und hat sich erneut dafür ausgesprochen, das ganze Spektrum an vorliegenden Studien bei der Evidenzsynthese zu nutzen.
Ich finde diesen Disput hochinteressant, weil dabei forschungslogische, forschungspraktische und grundlagentheoretische Aspekte ineinandergreifen (und durcheinandergehen). Meine vorläufige Sicht der Dinge:
1. Windeler hat Recht, wenn er sagt, RCTs hätten nicht per se eine geringe externe Validität und Fallstudien per se eine hohe. Dagegen spricht die Empirie, die Walach in seiner Replik so emphatisch mit dem Schlusssatz „we have an obligation to honor reality, not our ideas about reality“ bemüht. Dieser Satz, genau gelesen, hat es übrigens in sich: Ich möchte einmal wissen, wie man die Realität an sich, jenseits unserer Vorstellungen darüber, respektieren soll. Die Realität ist uns nur in unseren Vorstellungen gegeben, und zwar umso besser, je kontrollierter und täuschungssicherer unsere Erfahrungen sind, sprich je höher ihre interne Validität ist. Und wie hat man sich eigentlich hohe externe Validität bei fehlender oder marginaler interner Validität vorzustellen? Als science fiction, als Erzählung? Es mag ja sein, dass Fallstudien alltagsnah wirken, aber was hilft es, wenn noch so „realistisch“ beschriebene Zusammenhänge nur scheinbar bestehen?
Kommentare (41)