Punktschätzer in R - so geht's

Von Fabian
Kategorie: R
Lesezeit: 3 Minuten

Eine Punktsch#tzer stellt eine Zahl dar, die wir aus Stichprobendaten berechnen, um einen Populationsparameter zu schätzen. Dies dient als unsere bestmögliche Schätzung des wahren Populationsparameters.

Die folgende Tabelle zeigt die Punktschätzung, die wir verwenden, um Populationsparameter zu schätzen:

Messung Bevölkerungsparameter Punktschätzung
Mittelwert μ (Bevölkerungsmittelwert) x (Stichprobenmittelwert)
Anteil π (Bevölkerungsanteil) p (Stichprobenanteil)

In den folgenden Beispielen wird erläutert, wie Punktschätzungen für einen Bevölkerungsdurchschnitt und einen Bevölkerungsanteil in R berechnet werden.

Beispiel 1: Punktschätzung des Bevölkerungsdurchschnitts

Angenommen, wir möchten die mittlere Höhe (in Zoll) einer bestimmten Pflanzenart auf einem bestimmten Feld schätzen. Wir ziehen eine einfache Zufallsstichprobe von 13 Pflanzen und messen die Höhe jeder Pflanze.

Der folgende Code zeigt, wie der Stichprobenmittelwert berechnet wird:

#Daten definieren
data <- c(8, 8, 9, 12, 13, 13, 14, 15, 19, 22, 23, 23, 24)

#Beispielmittelwert berechnen
mean(data, na.rm = TRUE)

[1] 15.61538

Der Stichprobenmittelwert beträgt 15,6 Zoll. Dies ist unsere Punktschätzung für den Mittelwert der Grundgesamtheit.

Wir können auch den folgenden Code verwenden, um ein 95-%-Konfidenzintervall für den Mittelwert der Grundgesamtheit zu berechnen:

#Stichprobengröße, Stichprobenmittelwert und Stichprobenstandardabweichung ermitteln
n <- length(data)
xbar <- mean(data, na.rm = TRUE)
s <- sd(data)

#Fehlerquote berechnen
margin <- qt(0.975,df=n-1)*s/sqrt(n)

#untere und obere Grenze des Konfidenzintervalls berechnen
low <- xbar - margin
low

[1] 12.03575

high <- xbar + margin
high

[1] 19.19502

Das 95%-Konfidenzintervall für den Populationsmittelwert beträgt [12.0; 19.2] Zoll.

Beispiel 2: Punktschätzung des Bevölkerungsanteils

Angenommen, wir möchten den Anteil der Menschen in einer bestimmten Stadt schätzen, die ein bestimmtes Gesetz unterstützen. Wir befragen eine einfache Zufallsstichprobe von 20 Bürgern.

Der folgende Code zeigt, wie der Stichprobenanteil berechnet wird:

#Daten definieren
data <- c('Y', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'Y',
          'N', 'Y', 'Y', 'N', 'N', 'Y', 'Y', 'Y', 'N', 'N')

#gesamte Stichprobengröße ermitteln
n <- length(data)

#finde die Nummer, die mit "Ja" geantwortet hat
k <- sum(data == 'Y') 

#Beispielanteil finden
p <- k/n

p

[1] 0.6

Der Stichprobenanteil der Bürger, die das Gesetz unterstützen, beträgt 0,6. Dies stellt unsere Punktschätzung für den Bevölkerungsanteil dar.

Wir können auch den folgenden Code verwenden, um ein 95%-Konfidenzintervall für den Mittelwert der Grundgesamtheit zu berechnen:

#gesamte Stichprobengröße ermitteln
n <- length(data)

#finde die Nummer, die mit "Ja" geantwortet hat
k <- sum(data == 'Y') 

#Beispielanteil finden
p <- k/n

#Fehlerquote berechnen
margin <- qnorm(0.975)*sqrt(p*(1-p)/n)

#untere und obere Grenze des Konfidenzintervalls berechnen
low <- p - margin
low

[1] 0.3852967

high <- p + margin
high

[1] 0.8147033

Das 95 %-Konfidenzintervall für den Bevölkerungsanteil beträgt [0,39; 0,81].

Zusätzliche Ressourcen

So finden Sie Konfidenzintervalle in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: