Cluster-Stichprobe in R - so geht's

Von Fabian
Kategorie: R
Lesezeit: 2 Minuten

Forscher nehmen häufig Stichproben aus einer Population und verwenden die Daten aus der Stichprobe, um Rückschlüsse auf die Gesamtpopulation zu ziehen.

Eine häufig verwendete Stichprobenmethode ist die Cluster-Stichprobe, bei der eine Population in Cluster aufgeteilt wird und alle Mitglieder einiger Cluster ausgewählt werden, um in die Stichprobe aufgenommen zu werden.

In diesem Tutorial wird erklärt, wie Cluster-Sampling in R durchgeführt wird.

Beispiel: Cluster-Sampling in R

Angenommen, ein Unternehmen, das Stadtrundfahrten anbietet, möchte seine Kunden befragen. Aus zehn Touren, die sie an einem Tag geben, wählen sie zufällig vier Touren aus und bitten jeden Kunden, seine Erfahrung auf einer Skala von 1 bis 10 zu bewerten.

Der folgende Code zeigt, wie Sie ein synthetisches Dataframe in R erstellen, mit dem Sie arbeiten können:

#Machen Sie dieses Beispiel reproduzierbar
set.seed(1)

#Dataframe erstellen
df <- data.frame(tour = rep(1:10, each=20),
                 experience = rnorm(200, mean=7, sd=1))

#Die ersten sechs Zeilen des Dataframes anzeigen
head(df)

  tour experience
1    1   6.373546
2    1   7.183643
3    1   6.164371
4    1   8.595281
5    1   7.329508
6    1   6.179532

Der folgende Code zeigt, wie Sie eine Stichprobe von Kunden erhalten, indem Sie vier Touren zufällig auswählen und jedes Mitglied dieser Touren in die Stichprobe einbeziehen:

#wähle zufällig 4 Reisegruppen aus den 10 aus
clusters <- sample(unique(df$tour), size=4, replace=F)

#Stichprobe als alle Mitglieder definieren, die zu einer der 4 Reisegruppen gehören
cluster_sample <- df[df$tour %in% clusters, ]

#Sehen Sie, wie viele Kunden von jeder Tour kamen
table(cluster_sample$tour)

 2  7  8 10 
20 20 20 20 

Aus der Ausgabe können wir Folgendes ersehen:

  • 20 Kunden aus Reisegruppe Nr. 2 wurden in die Stichprobe aufgenommen.
  • 20 Kunden aus Reisegruppe Nr. 7 wurden in die Stichprobe aufgenommen.
  • 20 Kunden aus der Reisegruppe Nr. 8 wurden in die Stichprobe aufgenommen.
  • 20 Kunden aus der Reisegruppe Nr. 10 wurden in die Stichprobe aufgenommen.

Somit besteht diese Stichprobe aus insgesamt 80 Kunden, die aus 4 verschiedenen Reisegruppen kamen.

Zusätzliche Ressourcen

Grundlegendes zu verschiedenen Arten von Stichprobenverfahren
Geschichtete Probenahme in R
Systematische Probenahme in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: