Wie groß sollte meine Stichprobe sein?

Eine wichtige Fage, die mir von Studenten aber auch Kunden immer wieder gestellt wird, wenn es um statistische Erhebungen geht. Eine definitive Antwort darauf gibt es nicht (wobei natürlich eine Vollerhebung immer vorzuziehen ist), wohl aber Richtwerte, an denen man sich orientieren kann.

Neben dem “Frischer Wind”-Blog, der sich ja hauptsächlich mit der spannenden Welt der regenerativen Energietechnik auseinandersetzt, betreibe ich noch zwei weitere Blogs, unter anderem den Statistikberatungs-Weblog, in dem ich in unregelmäßigen Abständen aus meiner Berufspraxis als Consultant und Lehrbeauftragter im Bereich der Statistik/Marktforschung berichte.

Normalerweise hüte ich mich davor, Themen in meinen verschiedenen Blogs “doppelt zu verwursten”, aktuell gibt es aber im Statistik-Blog einen neuen Download, auf den ich ebenfalls im “Frischen Wind” hinweisen möchte, da sicher auch der eine oder andere ScienceBlogs-Leser daran Interesse haben könnte. Es handelt sich um das von mir programmierte, kleine Tool SampleSizer, mit dem sich ein Richtwert für die optimale Stichprobengröße bei der Erhebung von Anteilswerten bestimmen lässt.

Die Software arbeitet mit einer Formel von William G. Cochran, der diese bereits in den 60er Jahren in seinem großartigen und inzwischen zum Standard avancierten Werk “Sampling Techniques” vorstellte. Obwohl die Kunst der Stichprobenziehung und das Wissen um die zur Erreichung einer gewissen Sicherheit minimal benötigte Stichprobengröße nicht neu ist, werden gerade in diesem Bereich leider noch immer viele Fehler gemacht.

Das fängt schon bei der häufig zu hörenden Behauptung “Je größer die Stichprobe, desto repräsentativer die Befragung” an. Dass dies nicht stimmt, wissen Statistiker und Marktforscher spätestens seit 1936, als der “Literary Digest” in der Wahl “Landon vs. Roosevelt” mit einer Riesen-Stichprobe von 2,3 Millionen Wahlberechtigten spektakulär danebenlag während George Gallup mit nur 5000 Probanden das Endergebnis fast auf die Nachkommastelle genau vorhersagen konnte.

Seitdem ist klar: Nicht nur auf die Größe der Stichprobe, sondern auch auf die Form der Stichprobenziehung kommt es an. Nichtsdestotrotz ist natürlich auch eine (angemessene) Größe von Bedeutung – und genau hierbei soll SampleSizer helfen. Einfach ein paar Werte (Größe der Grundgesamtheit, gewünschte Schwankungsbreite) in das Formular eingegeben, schon gibt einem die Software einen guten Richtwert für die Stichprobengröße an die Hand:

Gemäß dem großartigen Ausspruch der deutschen Vorzeige-Statistikerin Elisabeth Noelle-Neumann “Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden” lässt sich das Tool aber auch dann sinnvoll einsetzen, wenn man selbst keine Erhebung plant.

Wenn Sie das nächste Mal eine Statistik vor sich haben, bei der der Stichprobenumfang benannt wird, brauchen Sie nicht mehr darauf zu vertrauen, dass “es wurden 250 Personen befragt” schon richtig gewesen sein wird. Wenn Sie die Größe der Grundgesamtheit kennen oder in etwa erahnen können, dann machen Sie doch einfach die Probe aufs Exempel und geben Sie die Daten in den SampleSizer ein.

Wie groß sollte in einem hypothetischen Beispielfall die Stichprobe bei einer gewünschten Abweichung von +/- 3% vom “echten” Ergebnis ausfallen? 5.300 statt 250 Personen? Oha. Vielleicht also doch eine Abweichung von +/- 5%? Immer noch 3.800 Personen? Dann war die Stichprobe vielleicht doch etwas zu klein? Vielleicht gelangt man ja erst dann zu den 250 Personen, wenn man sich auf eine maximale Abweichung von +/- 40% vom Realwert einlässt. Das wäre dann allerdings in der Tat bereits eine große Unsicherheit im Ergebnis, die man auch entsprechend mit angeben müsste. Aber ist das auch geschehen?

Wie man sieht, macht ein Download der Software vielleicht sogar dann Sinn, wenn man selbst gar keine eigene Erhebung plant, sich aber bei der Interpretation von Stichprobenergebnissen kein X für ein U vormachen lassen möchte. In diesem Sinne hoffe ich, dass der eine oder andere etwas mit dem Programm anfangen kann. Eine kurze Beschreibung mit ein paar mathematischen Hintergrundinformationen sowie der Cochran-Formel findet sich hier, das Programm selbst kann hier heruntergeladen werden.

Das Programm ist selbstverständlich kostenlos und kann gerne auch im Internet weiterverteilt werden. Kritik, Hinweise und Verbesserungsvorschläge sowie Anregungen für weitere Programmierprojekte sind mir natürlich stets willkommen – vielleicht wünscht sich der eine oder andere Blogleser ja schon immer eine Software zur Berechnung von Anpassungstests oder Konfidenzintervallen? In jedem Fall immer her mit den Ideen – wenn sie in der Umsetzung nicht mit allzugroßem Aufwand verbunden sind, bin ich gerne bereit, mich damit zu befassen.

Kommentare (2)

Ich habe da noch ein Progrämmchen dass sich G-Power oder so nennt. Reizvoll ist dies insbesondere für einen experimentellen Versuchsaufbau.

Man kann da verschiedene Sachen machen, das schöne war eben, dass man sich die benötigte Stichprobengröße schätzen lassen könnte aufgrund des benötigten alpha, der Teststärke (1-beta) und der Effektstärke.

Fand es ganz hilfreich, allerdings nützt es mir in der Praxis jetzt relativ wenig, weil man viele Parameter kennen oder vernünftig schätzen können muß.

Moin!

Vielen Dank für diesen interessanten Artikel. Ich selber habe auch einen Artikel zur optimalen Stichprobenberechnung mit einigen Hintergrundinformationen zum Thema Power-Analyse, Fehlertypen, Signifikanz und Effektgrößen geschrieben. Der Artikel kann unter folgender URL aufgerufen werden: https://www.musicians-on-stage.de/?p=970
Man findet doch häufig noch gute Hinweise in bereits publizierten Studien, um eigene Effektgrößen schätzen zu können, sodass eine gute Basis für eine Stichprobengrößenberechnung gelegt ist. ich finde es gut, dass Sie in Ihrem Artikel auf die Stichprobenzusammensetzung hinweisen: die Sampling-Qualität ist unter Umständen entscheidend dafür, ob ein Effekt auftritt oder nicht (sampling bias), wie Henrich et al. diskutierten (https://journals.cambridge.org/action/displayAbstract?fromPage=online&aid=7825833).

Nochmals, vielen Dank für diesen lesenswerten Artikel.
Herzliche Grüße!

#1 knorke
25. März 2008

Ich habe da noch ein Progrämmchen dass sich G-Power oder so nennt. Reizvoll ist dies insbesondere für einen experimentellen Versuchsaufbau.

Man kann da verschiedene Sachen machen, das schöne war eben, dass man sich die benötigte Stichprobengröße schätzen lassen könnte aufgrund des benötigten alpha, der Teststärke (1-beta) und der Effektstärke.

Fand es ganz hilfreich, allerdings nützt es mir in der Praxis jetzt relativ wenig, weil man viele Parameter kennen oder vernünftig schätzen können muß.
#2 Friedrich
7. April 2012

Moin!

Vielen Dank für diesen interessanten Artikel. Ich selber habe auch einen Artikel zur optimalen Stichprobenberechnung mit einigen Hintergrundinformationen zum Thema Power-Analyse, Fehlertypen, Signifikanz und Effektgrößen geschrieben. Der Artikel kann unter folgender URL aufgerufen werden: https://www.musicians-on-stage.de/?p=970
Man findet doch häufig noch gute Hinweise in bereits publizierten Studien, um eigene Effektgrößen schätzen zu können, sodass eine gute Basis für eine Stichprobengrößenberechnung gelegt ist. ich finde es gut, dass Sie in Ihrem Artikel auf die Stichprobenzusammensetzung hinweisen: die Sampling-Qualität ist unter Umständen entscheidend dafür, ob ein Effekt auftritt oder nicht (sampling bias), wie Henrich et al. diskutierten (https://journals.cambridge.org/action/displayAbstract?fromPage=online&aid=7825833).

Nochmals, vielen Dank für diesen lesenswerten Artikel.
Herzliche Grüße!

Wie groß sollte meine Stichprobe sein?

Kommentare (2)

Über den Autor

Grundlagen der Statistik – die Blogserie

Blogroll

Arbeits-Weblinks

Gastbeiträge

Bücher (Schleichwerbung)

Neueste Beiträge

Frei nutzbare Online-Repositorien für wissenschaftliche Publikationen und Forschungsdaten

Von Wikis, Screencasts und Zoom-Vorlesungen – ein Erfahrungsbericht zum „Corona-Semester“

Lichtverschmutzung in “Discover Space” (Brøderbund, 1992)

Wie lässt sich das Benfordsche Gesetz mit Excel demonstrieren?

Racial Profiling und der Satz von Bayes

Letzte Kommentare

Archive

Wie groß sollte meine Stichprobe sein?

Kommentare (2)

Abonnieren

Über den Autor

Grundlagen der Statistik – die Blogserie

Blogroll

Arbeits-Weblinks

Gastbeiträge

Bücher (Schleichwerbung)

Worum geht es hier?

Neueste Beiträge

Frei nutzbare Online-Repositorien für wissenschaftliche Publikationen und Forschungsdaten

Von Wikis, Screencasts und Zoom-Vorlesungen – ein Erfahrungsbericht zum „Corona-Semester“

Lichtverschmutzung in “Discover Space” (Brøderbund, 1992)

Wie lässt sich das Benfordsche Gesetz mit Excel demonstrieren?

Racial Profiling und der Satz von Bayes

Letzte Kommentare

Archive