Die Standardabweichung von Daten wird oft vernachlässigt und es wird ignoriert, dass Variationen einer Größe innerhalb der Standardabweichung keine Bedeutung haben. Wenn zum Beispiel bei einer Meinungsumfrage herauskommt, dass die Zustimmung zur Politik der SPD von 30 auf 34 Prozent gestiegen ist, dann wird das die SPD sicherlich freuen und vermutlich wird die PR-Abteilung entsprechende Pressemitteilungen verfassen die erklären, dass die Bevölkerung die Arbeit der Partei würdigt, man auf dem richtigen Weg ist, und so weiter. Aber solange man die Standardabweichung nicht kennt, macht das alles keinen Sinn. Sagen wir, sie beträgt bei dieser Umfrage 5 Prozent. Das bedeutet folgendes: Würde man die Umfrage unmittelbar wiederholen, dann kann der Zustimmungswert dieses Mal auch bei 29 Prozent landen weil die SPD-Anhänger gerade alle am Klo waren und nicht ans Telefon gegangen sind. Oder aber man kriegt einen Wert von 39 Prozent. Wenn sich eine Messgröße um 4% ändert, die Standardabweichung aber 5% beträgt, dann ist die Änderung ohne Bedeutung weil es sich genau so gut um eine zufällige Fluktuation handeln kann.
Bei jeder realen Messung macht man Fehler und die hängen normalerweise vom Zufall ab. Die ersten, die sich intensiv damit auseinandersetzen mussten, waren die Astronomen im 17. und 18. Jahrhundert. Ausgerüstet mit Newtons Gravitationstheorie wollten sie die Bewegung der Himmelskörper berechnen und mussten dazu die Daten von Beobachtungen auswerten. Was ein Astronom misst, hängt von dem Gerät ab, das er benutzt, von den Unruhen in der Luft, von den Temperaturschwankungen, der Adaption der Augen an die Dunkelheit, der Stimmung des Astronom und jeder Menge anderer zufälliger Faktoren. Die Messwerte waren also nie identisch sondern variierten um einen Wert herum. Die Frage war nun: Wie genau sind die Messfehler verteilt?
Das entsprechende mathematische Gesetz dass die Verteilung von Messfehlern bestimmt wird heute Normalverteilung oder Gaußverteilung genannt (nach Carl Friedrich Gauß, der es formuliert hat – obwohl vor ihm auch andere Wissenschaftler schon ähnliche Ideen hatten). Der Form der Verteilung nach wird sie auch “Glockenkurve” genannt:
Wiederholt man eine Messung immer wieder und erstellt ein Diagramm, das anzeigt wie oft man einen bestimmten Wert erhalten hat, dann bekommt eine Kurve, die so aussieht wie in obigem Bild. Die meisten Messungen werden sich um einen Maximalwert herum verteilen; man wird aber auch immer wieder vereinzelte Messungen erhalten, die stark von diesem Wert abweichen. Die Kurve kann breit sein oder schmal und natürlich wird der Maximalwert je nach Art des gemessenen Phänomens ein anderer sein. Aber die grundlegende Form ist immer gleich und sie kann immer mit der gleichen mathematischen Formel beschrieben werden.
Diese Formel erklärt auch, wie die Standardabweichung zu interpretieren ist: Je stärker die einzelnen Messwerte varieren, desto breiter ist die Kurve. Folgen Messwerte einer Gaußverteilung, dann werden immer 68,27% der Messungen in einem Bereich von genau einer Standardabweichung landen. Würde man zum Beispiel 10.000 Weinexperten einen Wein testen lassen und ihre Noten aufzeichnen, würde man eine Glockenkurve erhalten. Sagen wir, der Maximalwert der Kurve liegt bei 56 Punkten und die Standardabweichung beträgt 5 Punkte. Dann haben 6827 Tester dem Wein eine Note gegeben, die zwischen 51 und 61 Punkten beträgt. 95,45% der Messungen liegen bei einer Glockenkurve im Bereich von zwei Standardabweichung. 9545 der Tester haben den Wein also mit einer Note zwischen 46 und 66 Punkten bewertet. 99,73 der Datenpunkte liegen im Bereich von drei Standardabweichung: 9973 Tester haben dem Wein zwischen 41 und 71 Punkte gegeben. Und so weiter.
Die Gaußverteilung erlaubt es, genau diese Zusammenhänge exakt zu berechnen. Führt man ein Experiment wiederholt durch, dann werden die zufälligen Fehler dafür sorgen, dass sich die Ergebnisse nach der Glockenkurve verteilen (das gilt aber nicht für systematische Fehler!). Eine genau Analyse ermöglicht es dann herauszufinden, wie exakt man mit diesen Messungen den tatsächlichen Wert bestimmt hat. Sie sagt uns aber auch, dass wir sehr gut aufpassen müssen, wenn wir nur wenige oder gar nur einen Datenpunkt zur Verfügung haben. Denn die Glockenkurve hat links und rechts kein Ende. Es wird zwar immer unwahrscheinlicher, dass ein einzelner Messwert extrem stark vom Mittelwert abweicht. Aber es gibt diese Abweichungen und wenn man nur eine einzige Messung macht kann man nicht sicher sein, dass man nicht gerade zufällig einen Extremwert gemessen hat, der vom tatsächlich Wert vollkommen abweicht.
Kommentare (41)