In der Statistik sind wir häufig daran interessiert, Merkmale bestimmter Bevölkerungsgruppen zu untersuchen. Zum Beispiel könnten wir daran interessiert sein zu studieren:

  • Die allgemeine Arbeitszufriedenheit von Maschinenbauingenieuren in einer bestimmten Stadt.
  • Politische Präferenzen von Personen in einem bestimmten Landkreis.
  • Die Altersverteilung von Personen in einem bestimmten Land.
  • Filmpräferenzen von Schülern einer bestimmten Schule.

In jedem dieser Beispiele möchten wir ein Verständnis für eine bestimmte Population oder Bevölkerung erlangen.

Population: Die gesamte Gruppe von Personen, die Sie studieren möchten.

Leider kann es teuer und zeitaufwändig sein, Daten für jede Person in einer Population zu sammeln, weshalb Forscher normalerweise Daten für eine Stichprobe aus einer Population sammeln und dann die Ergebnisse aus der Stichprobe auf die größere Population verallgemeinern.

Stichprobe: Eine Teilmenge der Bevölkerung.

Angenommen, wir möchten die Filmpräferenzen von Schülern einer bestimmten Schule mit insgesamt 1.000 Schülern verstehen. Da es zu lange dauern würde, jeden einzelnen Schüler zu befragen, könnten wir stattdessen eine Zufallsstichprobe von 100 Schülern ziehen und sie nach ihren Vorlieben fragen.

Beispiel Stichprobe aus Population

Die 1.000 Studenten repräsentieren die Bevölkerung, während die 100 zufällig ausgewählten Studenten die Stichprobe repräsentieren. Sobald wir Daten für die Stichprobe von 100 Studenten gesammelt haben, können wir diese Ergebnisse auf die Gesamtbevölkerung von 1.000 Studenten verallgemeinern, jedoch nur, wenn unsere Stichprobe repräsentativ für unsere Bevölkerung ist.

Repräsentative Stichprobe: Eine Stichprobe, bei der die Merkmale der Personen eng mit den Merkmalen der Gesamtbevölkerung übereinstimmen.

Idealerweise möchten wir, dass unsere Stichprobe wie eine „Mini-Version“ unserer Bevölkerung ist. Wenn sich die gesamte Studentenbevölkerung zu 50% aus Mädchen und zu 50% aus Jungen zusammensetzt, wäre unsere Stichprobe nicht repräsentativ, wenn sie 90% Jungen und nur 10% Mädchen umfassen würde.

Beispiel einer Stichprobe, die nicht repräsentativ für eine Population ist

Oder wenn sich die Gesamtbevölkerung zu gleichen Teilen aus Neulingen, Studenten im zweiten Jahr, Junioren und Senioren zusammensetzt, wäre unsere Stichprobe nicht repräsentativ, wenn sie nur Neulinge umfassen würde.

Eine Stichprobe, die nicht repräsentativ für eine Population ist

Warum eine repräsentative Stichprobe so wichtig ist

Der Grund, warum wir eine repräsentative Stichprobe wünschen, besteht darin, dass wir die Ergebnisse der Stichprobe sicher auf die Bevölkerung übertragen können.

Angenommen, wir möchten wissen, wie viel Prozent der Schüler einer bestimmten Schule „Drama“ als ihr Lieblingsfilmgenre bevorzugen. Wenn die gesamte Studentenbevölkerung aus 50% Jungen und 50% Mädchen besteht, kann eine Stichprobe mit 90% Jungen und 10% Mädchen zu voreingenommenen Ergebnissen führen, wenn weit weniger Jungen Drama als ihr Lieblingsgenre bevorzugen.

Oder wenn die Gesamtbevölkerung zu gleichen Teilen aus Neulingen, Studenten im zweiten Jahr, Junioren und Senioren besteht, kann eine Stichprobe mit nur Neulingen auch zu voreingenommenen Ergebnissen führen, wenn jüngere Studenten (z. B. Neulinge) Drama mit viel höheren Raten bevorzugen als ältere Schüler.

Wenn die Merkmale der Personen in unserer Stichprobe nicht genau mit den Merkmalen der Personen in der Gesamtbevölkerung übereinstimmen, können wir die Ergebnisse der Stichprobe nicht mit Sicherheit auf die Gesamtbevölkerung übertragen.

So erhalten Sie eine repräsentative Stichprobe

Um die Wahrscheinlichkeit zu maximieren, dass wir eine repräsentative Stichprobe erhalten, müssen wir uns bei der Erstellung unserer Stichprobe auf zwei Dinge konzentrieren:

1. Verwenden Sie ein geeignetes Stichprobenverfahren.**

Es gibt viele Möglichkeiten, eine Stichprobe aus einer Population zu erhalten, aber hier sind drei Methoden, mit denen wahrscheinlich eine repräsentative Stichprobe erhalten wird:

Einfache Zufallsstichprobe: Wählen Sie Personen nach dem Zufallsprinzip mithilfe eines Zufallszahlengenerators oder einer Zufallsauswahl aus.

  • Beispiel: Weisen Sie allen 1.000 Schülern eine Nummer zu. Verwenden Sie dann einen Zufallszahlengenerator, um 100 Zufallszahlen auszuwählen, und verwenden Sie die entsprechenden Schüler als Mitglieder in der Stichprobe.
  • Vorteil: Einfache Zufallsstichproben sind normalerweise repräsentativ für die Population, an der wir interessiert sind, da jedes Mitglied die gleiche Chance hat, in die Stichprobe aufgenommen zu werden.

Systematische Zufallsstichprobe: Ordnen Sie jedes Mitglied einer Population in eine bestimmte Reihenfolge. Wählen Sie einen zufälligen Startpunkt und wählen Sie jedes n-te Mitglied aus, das in der Stichprobe enthalten sein soll.

  • Beispiel: Erstellen Sie eine Liste in alphabetischer Reihenfolge basierend auf dem Nachnamen aller 1.000 Schüler, wählen Sie zufällig einen Startpunkt aus und wählen Sie jeden 10. Schüler aus, der in der Stichprobe enthalten sein soll.
  • Vorteil: Systematische Zufallsstichproben sind normalerweise repräsentativ für die Population, an der wir interessiert sind, da jedes Mitglied die gleiche Chance hat, in die Stichprobe aufgenommen zu werden.

Geschichtete Zufallsstichprobe: Teilen Sie eine Population in Gruppen auf. Wählen Sie zufällig einige Mitglieder aus jeder Gruppe aus, die in der Stichprobe enthalten sein sollen.

  • Beispiel: Teilen Sie alle Schüler nach ihrer Klasse auf – Erstsemester, Studenten im zweiten Jahr, Junioren und Senioren. Wählen Sie nach dem Zufallsprinzip 25 Schüler aus jeder Klasse aus, die in die Stichprobe aufgenommen werden sollen.
  • Vorteil: Geschichtete Zufallsstichproben stellen sicher, dass die gleiche Anzahl von Schülern aus jeder Klasse in die Stichprobe einbezogen wird.

2. Stellen Sie sicher, dass die Stichrobe groß genug ist.**

Neben der Verwendung einer geeigneten Stichprobenmethode ist es wichtig sicherzustellen, dass die Stichprobe groß genug ist, damit wir über genügend Daten verfügen, um sie auf die größere Population zu übertragen.

Zum Beispiel könnte eine Stichprobe von acht Schülern – ein Junge und ein Mädchen aus jeder Klasse – eine Mini-Version der größeren Bevölkerung darstellen, aber sie ist wahrscheinlich nicht groß genug, um die gesamte Variabilität zu erfassen, die natürlich in den Antworten der Schüler besteht.

Wie groß muss Ihre Stichprobe sein?

Das hängt von folgenden Faktoren ab:

  • Bevölkerungsgröße: Im Allgemeinen muss die Stichprobe umso größer sein, je größer die Bevölkerungszahl ist. Zum Beispiel benötigen Sie eine viel größere Stichprobe, wenn Sie Ihre Ergebnisse auf ein ganzes Land im Vergleich zu einer einzelnen Stadt übertragen möchten.
  • Konfidenzniveau: Wie sicher Sie sein möchten, dass der wahre Bevölkerungswert, an dem Sie interessiert sind, in Ihr Konfidenzintervall fällt. Zu den allgemeinen Konfidenzniveaus gehören 90%, 95% und 99%. Je höher das Konfidenzniveau, desto größer muss Ihre Stichprobe sein.
  • Fehlerquote: Wie viel Fehler möchten Sie tolerieren? Kein Beispiel ist perfekt, daher müssen Sie bereit sein, zumindest einige Fehler zu akzeptieren. Die meisten Forschungsstudien werden ihre Ergebnisse mit einer Fehlerquote melden, zum Beispiel „40% der Studenten gaben an, dass Drama ihr Lieblingsgenre ist, mit einer Fehlerquote von +/- 5%.“ Je geringer die Fehlerquote ist, desto kleiner muss Ihre Stichprobe sein.

Es gibt zahlreiche Online-Taschenrechner, mit denen Sie anhand dieser Faktoren bestimmen können, wie groß Ihre Stichprobe sein muss. Dieser Rechner von Survey Monkey ist besonders einfach zu bedienen.

Dinge, die Sie beachten sollten

Beachten Sie Folgendes, auch wenn Sie eine geeignete Probenahmemethode verwenden und sicherstellen, dass Ihre Probe groß genug ist:

  • Es wird immer einen gewissen Stichprobenfehler geben. Die Stichprobe wird niemals perfekt repräsentativ für die größere Bevölkerung sein.
  • Je größer die Stichprobe ist, desto wahrscheinlicher ist sie im Allgemeinen repräsentativ für die Bevölkerung.
  • Sie müssen ein Gleichgewicht zwischen Stichprobengröße und realen Variablen wie Zeit und Kosten herstellen. Eine größere Stichprobe hat möglicherweise eine höhere Wahrscheinlichkeit, die Gesamtbevölkerung darzustellen, ist jedoch möglicherweise teurer und zeitaufwändiger zu beschaffen.
Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: