So berechnen Sie die Fehlerquote in Excel

Von Fabian
Kategorie: Excel
Lesezeit: 4 Minuten

In der Statistik sind wir häufig daran interessiert, einen Populationsparameter anhand einer Stichprobe zu schätzen. Zum Beispiel möchten wir vielleicht die mittlere Größe der Schüler einer bestimmten Schule wissen. Wenn die Schule insgesamt 1.000 Schüler hat, kann es zu lange dauern, jeden Schüler zu messen. Stattdessen können wir eine einfache Zufallsstichprobe von 50 Schülern ziehen und die mittlere Größe der Schüler in dieser Stichprobe berechnen.

Und während die mittlere Größe der Schüler in der Stichprobe eine gute Schätzung des tatsächlichen Bevölkerungsmittels sein könnte, gibt es keine Garantie dafür, dass der Stichprobenmittelwert genau dem Bevölkerungsdurchschnitt entspricht. Mit anderen Worten, es besteht eine gewisse Unsicherheit.

Eine Möglichkeit, die Unsicherheit zu berücksichtigen, besteht darin, ein Konfidenzintervall zu erstellen. Dies ist ein Wertebereich, von dem wir glauben, dass er den wahren Populationsparameter enthält.

Wenn beispielsweise die mittlere Größe der Schüler in der Stichprobe 67 Zoll beträgt, kann unser Konfidenzintervall für die wahre mittlere Größe aller Schüler in der Bevölkerung [65 Zoll, 69 Zoll] betragen, was bedeutet, dass wir zuversichtlich sind, dass der wahre Mittelwert Die Größe der Studenten in der Bevölkerung liegt zwischen 65 und 69 Zoll.

Ein Konfidenzintervall besteht aus zwei Teilen:

Punktschätzung – häufig ist dies ein Stichprobenmittelwert oder ein Stichprobenanteil.

Fehlergrenze – eine Zahl, die die Unsicherheit der Punktschätzung darstellt.

Die Formel zum Erstellen eines Konfidenzintervalls lautet:

Konfidenzintervall = Punktschätzung +/- Fehlerquote

Fehlergrenze Formel

Wenn Sie ein Konfidenzintervall für einen Populationsmittelwert erstellen, lautet die Formel für die Fehlerquote:

Fehlergrenze: Z * σ / √n

Wobei:

  • Z: Z-Punktzahl
  • σ: Populationsstandardabweichung
  • n: Stichprobengröße

Hinweis: Wenn die Populationsstandardabweichung unbekannt ist, können Sie Z durch t n-1 ersetzen. Dies ist der t-kritische Wert, der aus der t-Verteilungstabelle mit n-1 Freiheitsgraden stammt.

Wenn Sie ein Konfidenzintervall für einen Bevölkerungsanteil erstellen, lautet die Formel für die Fehlerquote:

Fehlergrenze: Z * √ (p * (1-p)) / n)

Wobei:

  • Z: Z-Punktzahl
  • p: Probenanteil
  • n: Stichprobengröße

Beachten Sie, dass der Z-Wert, den Sie für diese Berechnung verwenden, von Ihrem gewählten Konfidenzniveau abhängt. Die folgende Tabelle zeigt die Z-Werte, die mit allgemeinen Konfidenzniveaus verbunden sind:

KonfidenzniveauZ-Wert
80%1,282
85%1.44
90%1,645
95%1,96
99%2,576

Als Nächstes werden zwei Beispiele zur Berechnung der Fehlerquote in Excel vorgestellt.

Beispiel 1: Fehlergrenze für einen Bevölkerungsdurchschnitt

Angenommen, wir möchten die mittlere Höhe einer bestimmten Pflanze ermitteln. Es ist bekannt, dass die Populationsstandardabweichung σ 2 Zoll beträgt. Wir sammeln eine Zufallsstichprobe von 100 Pflanzen und stellen fest, dass der Stichprobenmittelwert 14 Zoll beträgt. Finden Sie ein 95%-Konfidenzintervall für die wahre mittlere Höhe dieser bestimmten Pflanze.

Da wir ein Konfidenzintervall für die mittlere Höhe finden, verwenden wir die Formel für die Fehlergrenze: Z * σ / √n

Das folgende Bild zeigt, wie die Fehlerquote für dieses Konfidenzintervall berechnet wird:

Fehlerspanne =B5*(B3/WURZEL(B4))

Fehlerquote 1

Die Fehlerquote beträgt 0,392.

Fehlerquote 2

Somit würde das Konfidenzintervall für die wahre mittlere Höhe der Pflanzen 14 + / 0,392 = [13,608, 14,392] betragen.

Beispiel 2: Fehlerquote für einen Bevölkerungsanteil

Angenommen, wir möchten wissen, wie viel Prozent der Personen in einer bestimmten Stadt einen Kandidaten namens Bob unterstützen. In einer einfachen Zufallsstichprobe von 200 Personen gaben 120 an, Bob zu unterstützen (d.h. 60% unterstützen ihn). Finden Sie ein Konfidenzintervall von 99% für den tatsächlichen Prozentsatz der Menschen in der gesamten Stadt, die Bob unterstützen.

Da wir ein Konfidenzintervall für die mittlere Höhe finden, verwenden wir die Formel für die Fehlergrenze: Z * √ (p * (1-p)) / n)

Das folgende Bild zeigt, wie die Fehlerquote für dieses Konfidenzintervall berechnet wird:

Fehlerspanne =B5*WURZEL((B3*(1-B3))/B4)

Fehlerquote 3

Die Fehlerquote beträgt 0,089.

Fehlerquote 4

Somit beträgt das Konfidenzintervall für den tatsächlichen Prozentsatz der Personen in dieser Stadt, die Bob unterstützen, 0,6 +/- 0,089 = [0,511, 0,689].

Hinweise zum Ermitteln des geeigneten Z-Werts oder T-Werts

Wenn Sie das Konfidenzintervall für einen Populationsmittelwert ermitteln und sich nicht sicher sind, ob Sie einen Z-Wert oder einen t-Wert für die Berechnung der Fehlerquote verwenden sollen, lesen Sie dieses hilfreiche Diagramm, um sich zu entscheiden:

z-Tabelle vs. T-Tabelle

Wenn Sie keine hilfreiche Tabelle haben, die Ihnen zeigt, welchen Z-Wert oder T-Wert Sie basierend auf Ihrem Konfidenzintervall verwenden sollen, können Sie in Excel immer die folgenden Befehle verwenden, um den richtigen Z-Wert oder T-Wert zu finden benutzen:

So finden Sie den Z-Wert: = NORM.INV(Wahrscheinlichkeit, 0, 1)

Um beispielsweise den Z-Wert zu ermitteln, der einem Konfidenzniveau von 95% zugeordnet ist, geben Sie = NORM.INV(.975, 0, 1) ein, was sich als 1,96 herausstellt.

So finden Sie den t-Wert: = T.INV(Wahrscheinlichkeit, Freiheitsgrade)

Um beispielsweise den t-Wert zu ermitteln, der mit einem Konfidenzniveau von 90% und 12 Freiheitsgraden verbunden ist, geben Sie = T.INV(.95, 12) ein, was sich als 1,78 herausstellt.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: