In der Statistik sind wir oft daran interessiert, Daten zu sammeln, damit wir einige Forschungsfragen beantworten können.

Beispielsweise möchten wir möglicherweise die folgenden Fragen beantworten:

1. Wie hoch ist das mittlere Haushaltseinkommen in Miami, Florida?

2. Was ist das Durchschnittsgewicht einer bestimmten Schildkrötenpopulation?

3. Wie viel Prozent der Einwohner eines bestimmten Landkreises unterstützen ein bestimmtes Gesetz?

In jedem Szenario sind wir daran interessiert, eine Frage zu einer Population zu beantworten, die jedes mögliche einzelne Element darstellt, das wir messen möchten.

Anstatt jedoch Daten zu jedem Individuum in einer Population zu sammeln, sammeln wir stattdessen Daten zu einer Stichprobe der Population, die einen Teil der Bevölkerung darstellt.

Bevölkerung: Jedes mögliche einzelne Element, an dessen Messung wir interessiert sind.
Stichprobe: Ein Teil der Bevölkerung.

Hier ist ein Beispiel für eine Population im Vergleich zu einer Stichprobe in den drei Intro-Beispielen.

Beispiel 1: Wie hoch ist das mittlere Haushaltseinkommen in Miami, Florida?

Die gesamte Bevölkerung könnte 500.000 Haushalte umfassen, aber wir könnten nur sammeln Daten auf einer Stichprobe von 2000 insgesamt Haushalten.

Bevölkerung vs. Stichprobe

2. Was ist das Durchschnittsgewicht einer bestimmten Schildkrötenpopulation?

Die gesamte Population könnte 800 Schildkröten umfassen, aber wir könnten nur Daten über eine Stichprobe von 30 Schildkröten sammeln.

Unterschied zwischen Population und Stichprobe

3. Wie viel Prozent der Einwohner eines bestimmten Landkreises unterstützen ein bestimmtes Gesetz?

Die gesamte Bevölkerung könnte 50.000 Einwohner zählen, aber wir könnten nur sammeln Daten auf einer Stichprobe von 1.000 Einwohnern.

Beispiel für Population vs. Stichprobe

Warum Proben verwenden?

Es gibt mehrere Gründe, warum wir normalerweise Daten zu Proben anstatt zu ganzen Populationen sammeln, darunter:

1. Es ist zu zeitaufwändig, Daten über eine gesamte Bevölkerung zu sammeln. Wenn wir beispielsweise das mittlere Haushaltseinkommen in Miami, Florida, ermitteln möchten, kann es Monate oder sogar Jahre dauern, bis das Einkommen für jeden Haushalt erreicht ist. Bis wir alle diese Daten sammeln, hat sich möglicherweise die Bevölkerung verändert oder die interessierende Forschungsfrage ist möglicherweise nicht mehr von Interesse.

2. Es ist zu kostspielig, Daten über eine gesamte Bevölkerung zu sammeln. Es ist oft zu teuer, Daten für jede Person in einer Population zu sammeln, weshalb wir stattdessen Daten für eine Stichprobe sammeln.

3. Es ist nicht möglich, Daten über eine gesamte Bevölkerung zu sammeln. In vielen Fällen ist es einfach nicht möglich, Daten für jede Person in einer Population zu sammeln. Zum Beispiel kann es außerordentlich schwierig sein, jede Schildkröte in einer bestimmten Population, an der wir interessiert sind, aufzuspüren und zu wiegen.

Durch das Sammeln von Daten zu Proben können wir Informationen über eine bestimmte Population viel schneller und billiger sammeln.

Und wenn unsere Stichprobe repräsentativ für die Bevölkerung ist, können wir die Ergebnisse einer Stichprobe mit einem hohen Maß an Vertrauen auf die größere Bevölkerung übertragen.

Die Bedeutung repräsentativer Stichproben

Wenn wir eine Stichprobe aus einer Population sammeln, möchten wir im Idealfall, dass die Stichprobe einer „Mini-Version“ unserer Population entspricht.

Angenommen, wir möchten die Filmpräferenzen von Schülern in einem bestimmten Schulbezirk mit insgesamt 5.000 Schülern verstehen. Da es zu lange dauern würde, jeden einzelnen Schüler zu befragen, könnten wir stattdessen eine Stichprobe von 100 Schülern nehmen und sie nach ihren Vorlieben fragen.

Wenn die gesamte Studentenbevölkerung zu 50% aus Mädchen und zu 50% aus Jungen besteht, wäre unsere Stichprobe nicht repräsentativ, wenn sie 90% Jungen und nur 10% Mädchen umfassen würde.

Repräsentative Stichprobe einer Bevölkerung

Oder wenn sich die Gesamtbevölkerung zu gleichen Teilen aus Neulingen, Studenten im zweiten Jahr, Junioren und Senioren zusammensetzt, wäre unsere Stichprobe nicht repräsentativ, wenn sie nur Neulinge umfassen würde.

Repräsentative Stichprobe einer Bevölkerung 2

Eine Stichprobe ist repräsentativ für eine Population, wenn die Merkmale der Personen in der Stichprobe eng mit den Merkmalen der Personen in der Gesamtbevölkerung übereinstimmen.

In diesem Fall können wir die Ergebnisse der Stichprobe mit Sicherheit auf die Gesamtbevölkerung übertragen.

So erhalten Sie Proben

Es gibt viele verschiedene Methoden, mit denen wir Proben aus Populationen erhalten können.

Um die Wahrscheinlichkeit zu maximieren, dass wir eine repräsentative Stichprobe erhalten, können wir eine der drei folgenden Methoden anwenden:

Einfache Zufallsauswahl: Wählen Sie Personen nach dem Zufallsprinzip mithilfe eines Zufallsgenerators oder einer Zufallsauswahl aus.

Systematische Zufallsstichprobe: Ordnen Sie jedes Mitglied einer Population einer bestimmten Reihenfolge zu. Wählen Sie einen zufälligen Startpunkt und wählen Sie jedes n-te Mitglied aus, das in der Stichprobe enthalten sein soll.

Geschichtete Zufallsstichprobe: Teilen Sie eine Population in Gruppen auf. Wählen Sie zufällig einige Mitglieder aus jeder Gruppe aus, die in der Stichprobe enthalten sein sollen.

Bei jeder dieser Methoden hat jedes Individuum in der Population die gleiche Wahrscheinlichkeit, in die Stichprobe aufgenommen zu werden. Dies maximiert die Wahrscheinlichkeit, dass wir eine Stichprobe erhalten, die eine „Mini-Version“ der Bevölkerung darstellt.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: