Konfidenzintervall für die Differenz zwischen Stichprobenanteilen

Ein Konfidenzintervall für die Differenz zwischen Stichprobenanteilen ist ein Wertebereich, der mit einer gewissen Wahrscheinlichkeit die wahre Differenz zwischen zwei Bevölkerungsanteilen enthält.

Dieses Tutorial erklärt Folgendes:

Die Motivation für die Erstellung dieses Konfidenzintervalls.
Die Formel zur Erstellung dieses Konfidenzintervalls.
Ein Beispiel für die Berechnung dieses Konfidenzintervalls.
Wie dieses Konfidenzintervall zu interpretieren ist.

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Motivation

Oft sind Forscher daran interessiert, die Differenz zwischen zwei Bevölkerungsanteilen zu schätzen. Um diese Differenz zu schätzen, ziehen sie eine Zufallsstichprobe aus jeder Population und berechnen den Anteil für jede Stichprobe. Anschließend können sie die Differenz zwischen den beiden Anteilen vergleichen.

Sie können jedoch nicht mit Sicherheit wissen, ob der Unterschied zwischen den Stichprobenanteilen mit dem tatsächlichen Unterschied zwischen den Bevölkerungsanteilen übereinstimmt. Deshalb können sie ein Konfidenzintervall für den Unterschied zwischen den beiden Anteilen erstellen. Dieses liefert einen Wertebereich, der wahrscheinlich die wahre Differenz zwischen den Bevölkerungsanteilen enthält.

Angenommen, wir wollen den Unterschied zwischen dem Anteil der Einwohner, die ein bestimmtes Gesetz im Bezirk A unterstützen, und dem Anteil, der das Gesetz im Bezirk B unterstützt, schätzen.

Da es in jedem Bezirk Tausende von Einwohnern gibt, würde es zu lange dauern und zu kostspielig sein, jeden einzelnen Einwohner in jedem Bezirk zu befragen.

Anstatt dessen könnte man eine einfache Zufallsstichprobe von Einwohnern aus jedem Bezirk nehmen und den Anteil der Befürworter des Gesetzes in jeder Stichprobe verwenden, um den wahren Unterschied in den Anteilen zwischen den beiden Bezirken zu schätzen:

Diffprops

Da es sich bei unseren Stichproben um Zufallsstichproben handelt, ist nicht gewährleistet, dass der Unterschied in den Anteilen zwischen den beiden Stichproben genau mit dem Unterschied in den Anteilen zwischen den beiden Grundgesamtheiten übereinstimmt. Um diese Ungewissheit zu erfassen, können wir ein Konfidenzintervall erstellen, das einen Bereich von Werten enthält, die wahrscheinlich die wahre Differenz der Anteile zwischen den beiden Populationen enthalten.

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Formel

Wir verwenden die folgende Formel, um ein Konfidenzintervall für eine Differenz zwischen zwei Bevölkerungsanteilen zu berechnen:

Konfidenzintervall = (p₁-p₂) +/- z*√(p₁(1-p₁)/n₁ + p₂(1-p₂)/n₂)

wobei:

p₁, p₂: Anteil Stichprobe 1, Anteil Stichprobe 2
z: der z-kritische Wert auf der Grundlage des Konfidenzniveaus
n₁, n₂: Stichprobenumfang 1, Stichprobenumfang 2

Der von Ihnen zu verwendende z-Wert hängt von dem von Ihnen gewählten Konfidenzniveau ab. Die folgende Tabelle zeigt den z-Wert, der den gängigen Konfidenzniveaus entspricht:

Konfidenzniveau

z-Wert

0.90

1.645

0.95

1.96

0.99

2.58

Beachten Sie, dass höhere Konfidenzniveaus größeren z-Werten entsprechen, was zu breiteren Konfidenzintervallen führt. Das bedeutet, dass z. B. ein 95 %-Konfidenzintervall breiter ist als ein 90 %-Konfidenzintervall für denselben Datensatz.

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Beispiel

Angenommen, wir wollen den Unterschied zwischen dem Anteil der Einwohner, die ein bestimmtes Gesetz im Bezirk A unterstützen, und dem Anteil, der das Gesetz im Bezirk B unterstützt, schätzen.

Stichprobe 1:

n₁ = 100
p₁ = 0,62 (d.h. 62 von 100 Einwohnern unterstützen das Gesetz)

Beispiel 2:

n₂ = 100
p₂ = 0,46 (d.h. 46 von 100 Einwohnern unterstützen das Gesetz)

So finden Sie verschiedene Konfidenzintervalle für die Differenz der Bevölkerungsanteile:

90% Konfidenzintervall:

(.62-.46) +/- 1.645*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0456, .2744]

95% Konfidenzintervall:

(.62-.46) +/- 1.96*√(.62(1-.62)/100 + .46(1-.46)/100) = [.0236, .2964]

99% Konfidenzintervall:

(.62-.46) +/- 2.58*√(.62(1-.62)/100 + .46(1-.46)/100) = [-0.0192, 0.3392]

Hinweis: Sie können diese Konfidenzintervalle auch mit dem Konfidenzintervall für die Differenz von Stichprobenanteilen - Rechner ermitteln.

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Interpretation

Wir würden ein Konfidenzintervall wie folgt interpretieren:

Es besteht eine 95%ige Chance, dass das Konfidenzintervall von [.0236, .2964] den wahren Unterschied im Anteil der Einwohner, die das Gesetz befürworten, zwischen den beiden Bezirken enthält.

Da dieses Intervall nicht den Wert "0" enthält, bedeutet dies, dass es mit hoher Wahrscheinlichkeit einen wahren Unterschied im Anteil der Einwohner gibt, die dieses Gesetz in Bezirk A im Vergleich zu Bezirk B unterstützen.

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Motivation

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Formel

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Beispiel

Konfidenzintervall für die Differenz zwischen Stichprobenanteilen: Interpretation

Statistik: Der Weg zur Datenanalyse

Konfidenzintervall für einen Korrelationskoeffizienten

So finden Sie ein Konfidenzintervall für einen Median (Schritt für Schritt)