Die Dieseldebatte hatte bei allem Unfug, der da hochgekocht wurde, auch manchen Kollateralnutzen. Also einen Nutzen, der mit der Debatte zusammenhängt, aber nicht wirklich intendiert wurde. Zum Beispiel, dass vielen Leuten wieder einmal der Unterschied zwischen Korrelation und Kausalität in Erinnerung gerufen wurde, also die Sache mit den Störchen und den Geburten, oder dem Gleichklang von 100 Lungenärzten und der Faktenlage. Manche haben sogar gelernt, dass Korrelation und Kausalität zwar zwei unterschiedliche Dinge sind, aber keine Gegensätze. Wenn zwei Ereignisse kausal zusammenhängen und dieser Zusammenhang nicht durch andere Effekte überdeckt wird, korrelieren sie auch. Umgekehrt: Wenn zwei Ereignisse korrelieren, kann dahinter ein kausaler Zusammenhang stehen, muss aber nicht. In der Epidemiologie helfen z.B. die Bradford-Hill-Kriterien, das zu beurteilen.
Es gibt deterministische Zusammenhänge, stochastische, empirische, semantische, logische, angenehme und unangenehme, einfache und komplizierte, finanzielle, genealogische, starke und schwache, vorübergehende und dauerhafte, interessante und uninteressante (nachzulesen beim Friseur, z.B. Beziehungen in Adelsfamilien), unbekannte und bekannte, von Lungenärzten bestrittene, überraschende, klare und verwirrende, pikante, kuriose und so manche mehr.
Ein empirischer, stochastischer und bekannter Zusammenhang ist der zwischen der sozialen Lage und der Lebenserwartung. Wohlstand und geordnete Verhältnisse verlängern das Leben. Das Robert Koch-Institut hat auf der Basis des Sozioökonomischen Panels (SOEP), einer großen repräsentativen Erhebung in Deutschland, diese Zusammenhänge gerade neu analysiert . Demnach leben Frauen der höchsten Einkommensgruppe (mindestens 150 % des Äquivalenzeinkommens) 4,4 Jahre länger als Frauen der untersten Einkommensgruppe (weniger als 60 % des Äquivalenzeinkommens), bei den Männern sind es 8,6 Jahre. Frühere Analysen mit den SOEP-Daten kamen zu etwas höheren Werten, dem RKI zufolge vor allem methodisch bedingt. Dass der Unterschied bei den Männern größer ausfällt, ist ein bekannter Zusammenhang. Männer sind in gewisser Hinsicht „sozial sensibler“.
Der Zusammenhang zwischen Sozialstatus und Lebenserwartung ist so stark, dass er sogar auf Unterschiede der Lebenserwartung auf der regionalen Ebene durchschlägt, z.B. zwischen Bundesländern oder Landkreisen. Auch das gehört zu den bekannten Zusammenhängen.
Solche Zusammenhänge werden, wenn es um zwei Merkmale geht, oft anhand von Korrelationskoeffizienten dargestellt. Wenn man von einem linearen Zusammenhang ausgeht und ein paar statistische Voraussetzungen erfüllt sind, nimmt man den Korrelationskoeffizienten nach Pearson, sonst den nach Spearman. Je höher der Korrelationskoeffizient, desto enger ist der Zusammenhang der beiden Merkmale. Vergleicht man nun die Korrelationskoeffizienten zwischen Einkommen und Lebenserwartung auf verschiedenen regionalen Aggregationsebenen, tritt ein Zusammenhang vom kuriosen Typ zutage: Je größer die regionale Aggregationsebene, desto höher der Korrelationskoeffizient. Das haben wir gerade einmal für die bayerischen Regionen durchgespielt und in der Hauszeitschrift „Bayern in Zahlen“ 2/2019 des Statistischen Landesamtes veröffentlicht (in Klammern sind die 95%-Konfidenzintervalle angegeben):
Dieser auf den ersten Blick kuriose Zusammenhang ist ein wenig bedachter, wenngleich bekannter Zusammenhang, denn man vergleicht auf höherer regionaler Aggregationsebene geografisch zusammenhängende Cluster, die im Hinblick auf ihre Merkmale homogener sind als eine Betrachtung ungeclusteter Einheiten mit ihrer ganzen Streuung. Fachleute der geografischen Statistik berücksichtigen das mit Methoden der geografischen Autokorrelation, damit kenne ich mich aber nicht aus, da geht es also um an sich zwar bekannte, mir aber nur rudimentär bekannte und von mir als einfachem Datenhandwerker rechnerisch nicht beherrschte Zusammenhänge.
Der Korrelationskoeffizient wird in der Literatur oft als „Effektmaß“ bezeichnet. Er ist aber erst einmal nur ein Assoziationsmaß, das anzeigt, wie eng zwei Merkmale zusammenhängen. Grafisch steht (bei linearem Zusammenhang) dahinter, wie nahe sich die Punktwolke der Merkmale an eine Gerade schmiegt. Ein ungerichteter Zusammenhang übrigens, zwischen Henne und Ei wird nicht unterschieden. Etwas anderes ist die Effektstärke, d.h. das Maß dafür, wie stark die unabhängige Variable die abhängige beeinflusst, ein gerichteter Zusammenhang. In der Tabelle oben ist dazu der Regressionskoeffizient angegeben, grafisch steht dahinter die Steigung der Geraden.
Wenn man den Zusammenhang zwischen Einkommen und Lebenserwartung inhaltlich näher untersuchen will, wird es schnell schwierig. Dann muss man sich Gedanken darüber machen, was es noch für interagierende Faktoren gibt, welche Rolle zeitliche Beziehungen zwischen den Einkommenswerten und der Lebenserwartung spielen und vieles mehr. Es geht also um komplizierte Zusammenhänge, die aber für den hier kurz beschriebenen Aggregationseffekt erst einmal nicht von Belang sind. Für dieses Thema möge das Fazit genügen, dass Zusammenhänge manchmal nicht absolut, sondern relativ sind, in dem Fall relativ zur betrachteten regionalen Aggregationsebene.
Kommentare (25)