Eine wichtige Fage, die mir von Studenten aber auch Kunden immer wieder gestellt wird, wenn es um statistische Erhebungen geht. Eine definitive Antwort darauf gibt es nicht (wobei natürlich eine Vollerhebung immer vorzuziehen ist), wohl aber Richtwerte, an denen man sich orientieren kann.

Neben dem “Frischer Wind”-Blog, der sich ja hauptsächlich mit der spannenden Welt der regenerativen Energietechnik auseinandersetzt, betreibe ich noch zwei weitere Blogs, unter anderem den Statistikberatungs-Weblog, in dem ich in unregelmäßigen Abständen aus meiner Berufspraxis als Consultant und Lehrbeauftragter im Bereich der Statistik/Marktforschung berichte.

Normalerweise hüte ich mich davor, Themen in meinen verschiedenen Blogs “doppelt zu verwursten”, aktuell gibt es aber im Statistik-Blog einen neuen Download, auf den ich ebenfalls im “Frischen Wind” hinweisen möchte, da sicher auch der eine oder andere ScienceBlogs-Leser daran Interesse haben könnte. Es handelt sich um das von mir programmierte, kleine Tool SampleSizer, mit dem sich ein Richtwert für die optimale Stichprobengröße bei der Erhebung von Anteilswerten bestimmen lässt.

Die Software arbeitet mit einer Formel von William G. Cochran, der diese bereits in den 60er Jahren in seinem großartigen und inzwischen zum Standard avancierten Werk “Sampling Techniques” vorstellte. Obwohl die Kunst der Stichprobenziehung und das Wissen um die zur Erreichung einer gewissen Sicherheit minimal benötigte Stichprobengröße nicht neu ist, werden gerade in diesem Bereich leider noch immer viele Fehler gemacht.

Das fängt schon bei der häufig zu hörenden Behauptung “Je größer die Stichprobe, desto repräsentativer die Befragung” an. Dass dies nicht stimmt, wissen Statistiker und Marktforscher spätestens seit 1936, als der “Literary Digest” in der Wahl “Landon vs. Roosevelt” mit einer Riesen-Stichprobe von 2,3 Millionen Wahlberechtigten spektakulär danebenlag während George Gallup mit nur 5000 Probanden das Endergebnis fast auf die Nachkommastelle genau vorhersagen konnte.

Seitdem ist klar: Nicht nur auf die Größe der Stichprobe, sondern auch auf die Form der Stichprobenziehung kommt es an. Nichtsdestotrotz ist natürlich auch eine (angemessene) Größe von Bedeutung – und genau hierbei soll SampleSizer helfen. Einfach ein paar Werte (Größe der Grundgesamtheit, gewünschte Schwankungsbreite) in das Formular eingegeben, schon gibt einem die Software einen guten Richtwert für die Stichprobengröße an die Hand:

i-682fc6c12636fd86b6c22b20f7691313-SampleSizer-thumb-512x375.gif

Gemäß dem großartigen Ausspruch der deutschen Vorzeige-Statistikerin Elisabeth Noelle-Neumann “Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden” lässt sich das Tool aber auch dann sinnvoll einsetzen, wenn man selbst keine Erhebung plant.

Wenn Sie das nächste Mal eine Statistik vor sich haben, bei der der Stichprobenumfang benannt wird, brauchen Sie nicht mehr darauf zu vertrauen, dass “es wurden 250 Personen befragt” schon richtig gewesen sein wird. Wenn Sie die Größe der Grundgesamtheit kennen oder in etwa erahnen können, dann machen Sie doch einfach die Probe aufs Exempel und geben Sie die Daten in den SampleSizer ein.

Wie groß sollte in einem hypothetischen Beispielfall die Stichprobe bei einer gewünschten Abweichung von +/- 3% vom “echten” Ergebnis ausfallen? 5.300 statt 250 Personen? Oha. Vielleicht also doch eine Abweichung von +/- 5%? Immer noch 3.800 Personen? Dann war die Stichprobe vielleicht doch etwas zu klein? Vielleicht gelangt man ja erst dann zu den 250 Personen, wenn man sich auf eine maximale Abweichung von +/- 40% vom Realwert einlässt. Das wäre dann allerdings in der Tat bereits eine große Unsicherheit im Ergebnis, die man auch entsprechend mit angeben müsste. Aber ist das auch geschehen?

Wie man sieht, macht ein Download der Software vielleicht sogar dann Sinn, wenn man selbst gar keine eigene Erhebung plant, sich aber bei der Interpretation von Stichprobenergebnissen kein X für ein U vormachen lassen möchte. In diesem Sinne hoffe ich, dass der eine oder andere etwas mit dem Programm anfangen kann. Eine kurze Beschreibung mit ein paar mathematischen Hintergrundinformationen sowie der Cochran-Formel findet sich hier, das Programm selbst kann hier heruntergeladen werden.

Das Programm ist selbstverständlich kostenlos und kann gerne auch im Internet weiterverteilt werden. Kritik, Hinweise und Verbesserungsvorschläge sowie Anregungen für weitere Programmierprojekte sind mir natürlich stets willkommen – vielleicht wünscht sich der eine oder andere Blogleser ja schon immer eine Software zur Berechnung von Anpassungstests oder Konfidenzintervallen? In jedem Fall immer her mit den Ideen – wenn sie in der Umsetzung nicht mit allzugroßem Aufwand verbunden sind, bin ich gerne bereit, mich damit zu befassen.

Kommentare (2)

  1. #1 knorke
    25. März 2008

    Ich habe da noch ein Progrämmchen dass sich G-Power oder so nennt. Reizvoll ist dies insbesondere für einen experimentellen Versuchsaufbau.

    Man kann da verschiedene Sachen machen, das schöne war eben, dass man sich die benötigte Stichprobengröße schätzen lassen könnte aufgrund des benötigten alpha, der Teststärke (1-beta) und der Effektstärke.

    Fand es ganz hilfreich, allerdings nützt es mir in der Praxis jetzt relativ wenig, weil man viele Parameter kennen oder vernünftig schätzen können muß.

  2. #2 Friedrich
    7. April 2012

    Moin!

    Vielen Dank für diesen interessanten Artikel. Ich selber habe auch einen Artikel zur optimalen Stichprobenberechnung mit einigen Hintergrundinformationen zum Thema Power-Analyse, Fehlertypen, Signifikanz und Effektgrößen geschrieben. Der Artikel kann unter folgender URL aufgerufen werden: http://www.musicians-on-stage.de/?p=970
    Man findet doch häufig noch gute Hinweise in bereits publizierten Studien, um eigene Effektgrößen schätzen zu können, sodass eine gute Basis für eine Stichprobengrößenberechnung gelegt ist. ich finde es gut, dass Sie in Ihrem Artikel auf die Stichprobenzusammensetzung hinweisen: die Sampling-Qualität ist unter Umständen entscheidend dafür, ob ein Effekt auftritt oder nicht (sampling bias), wie Henrich et al. diskutierten (http://journals.cambridge.org/action/displayAbstract?fromPage=online&aid=7825833).

    Nochmals, vielen Dank für diesen lesenswerten Artikel.
    Herzliche Grüße!