Konfidenzintervall für einen Anteilswert

Von Fabian
Kategorie: Tutorials
Lesezeit: 3 Minuten

Ein Konfidenzintervall für einen Anteilswert ist ein Wertebereich, der wahrscheinlich einen Bevölkerungsanteil mit einem bestimmten Konfidenzniveau enthält.

In diesem Tutorial wird Folgendes erklärt:

  • Die Motivation, ein Konfidenzintervall für einen Anteil zu erstellen
  • Die Formel zum Erstellen eines Konfidenzintervalls für einen Anteil
  • Ein Beispiel für die Berechnung eines Konfidenzintervalls für einen Anteil
  • Wie Sie ein Konfidenzintervall für einen Anteil interpretieren

Konfidenzintervall für einen Anteilswert: Motivation

Der Grund für die Erstellung eines Konfidenzintervalls für einen Anteilswert besteht darin, unsere Unsicherheit bei der Schätzung eines Bevölkerungsanteils zu erfassen.

Angenommen, wir möchten den Anteil der Menschen in einem bestimmten Landkreis schätzen, die für ein bestimmtes Gesetz sind. Da es in der Grafschaft Tausende von Einwohnern gibt, wäre es zu kostspielig und zeitaufwändig, jeden Einwohner nach seiner Haltung zum Gesetz zu fragen.

Stattdessen könnten wir eine einfache Zufallsstichprobe von Bewohnern auswählen und jeden fragen, ob sie das Gesetz unterstützen oder nicht:

Beispiel für eine Schätzung des Bevölkerungsanteils

Da wir eine zufällige Stichprobe von Einwohnern auswählen, gibt es keine Garantie dafür, dass der Anteil der Einwohner in der Stichprobe, die für das Gesetz sind, genau mit dem Anteil der Einwohner im gesamten Landkreis übereinstimmt, die für das Gesetz sind. Um diese Unsicherheit zu erfassen, können wir ein Konfidenzintervall erstellen, das eine Reihe von Werten enthält, die wahrscheinlich den tatsächlichen Anteil der Einwohner enthalten, die für das Gesetz im gesamten Landkreis sind.

Konfidenzintervall für einen Anteil p: Formel

Wir verwenden die folgende Formel, um ein Konfidenzintervall für einen Bevölkerungsanteil zu berechnen:

Konfidenzintervall = p +/- z*(√p(1-p) / n)

wobei:

  • p: Stichprobenanteil
  • z: der gewählte z-Wert
  • n: Stichprobengröße

Der von Ihnen verwendete Z-Wert hängt von dem von Ihnen gewählten Konfidenzniveau ab. Die folgende Tabelle zeigt den Z-Wert, der den gängigen Konfidenzstufen entspricht:

Konfidenzniveauz-Wert
0.901.645
0.951.96
0.992.58

Beachten Sie, dass höhere Konfidenzniveaus größeren z-Werten entsprechen, was zu breiteren Konfidenzintervallen führt. Dies bedeutet, dass beispielsweise ein 95%-Konfidenzintervall breiter ist als ein 90%-Konfidenzintervall für denselben Datensatz.

Konfidenzintervall für einen Anteil p: Beispiel

Angenommen, wir möchten den Anteil der Einwohner eines Landkreises schätzen, die für ein bestimmtes Gesetz sind. Wir wählen eine Zufallsstichprobe von 100 Einwohnern aus und fragen sie nach ihrer Haltung zum Gesetz. Hier sind die Ergebnisse:

Probengröße n = 100
Anteil zugunsten des Gesetzes p = 0,56

So finden Sie verschiedene Konfidenzintervalle für den Bevölkerungsanteil:

90% Konfidenzintervall: 0.56 +/- 1.645*(√.56(1-.56) / 100) = [0.478, 0.642]

95% Konfidenzintervall: 0.56 +/- 1.96*(√.56(1-.56) / 100) = [0.463, 0.657]

99% Konfidenzintervall: 0.56 +/- 2.58*(√.56(1-.56) / 100) = [0.432, 0.688]

Konfidenzintervall für einen Anteil: Interpretation

Wir würden ein Konfidenzintervall folgendermaßen interpretieren:

Es besteht eine Wahrscheinlichkeit von 95%, dass das Konfidenzintervall von [0,463, 0,657] den tatsächlichen Bevölkerungsanteil der Einwohner enthält, die für dieses bestimmte Gesetz sind.

Eine andere Möglichkeit, dasselbe zu sagen, besteht darin, dass nur eine Wahrscheinlichkeit von 5% besteht, dass der tatsächliche Bevölkerungsanteil außerhalb des 95%-Konfidenzintervalls liegt. Das heißt, es besteht nur eine 5% ige Wahrscheinlichkeit, dass der tatsächliche Anteil der Einwohner des Landkreises, die das Gesetz unterstützen, weniger als 46,3% oder mehr als 65,7% beträgt.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: