Um festzustellen, ob die Varianzen zweier Populationen gleich sind, können wir das Varianzverhältnis σ 21 / σ 22 berechnen, wobei σ 21 die Varianz von Population 1 und σ 22 die Varianz von Population 2 ist.

Um das wahre Populationsvarianzverhältnis abzuschätzen, nehmen wir normalerweise eine einfache Zufallsstichprobe aus jeder Population und berechnen das Stichprobenvarianzverhältnis s 12 / s 22, wobei s 12 und s 22 die Stichprobenvarianzen für Stichprobe 1 und Stichprobe sind 2.

Bei diesem Test wird angenommen, dass sowohl s 12 als auch s 22 aus unabhängigen Proben der Größe n 1 und n 2 berechnet werden, die beide aus normalverteilten Populationen stammen.

Je weiter dieses Verhältnis von eins entfernt ist, desto stärker sind die Hinweise auf ungleiche Populationsabweichungen.

Das (1-α) 100%-Konfidenzintervall für σ 21 / σ 22 ist definiert als:

(s 12 / s 22 ) * F n 1 -1, n 2 -1, α / 2 ≤ σ 21 / σ 22 ≤ (s 12 / s 22 ) * F n 2 -1, n 1 -1,α / 2

wobei F n 2 -1, n 1 -1, α / 2 und F n 1 -1, n 2 -1,α / 2 sind die kritischen Werte aus der F-Verteilung für das gewählte Signifikanzniveau α.

Die folgenden Beispiele veranschaulichen, wie ein Konfidenzintervall für σ 21 / σ 22 mit drei verschiedenen Methoden erstellt wird:

  • Von Hand
  • Verwenden von Microsoft Excel
  • Verwendung der Statistiksoftware R.

Für jedes der folgenden Beispiele werden die folgenden Informationen verwendet:

  • α = 0,05
  • n 1 = 16
  • n 2 = 11
  • s 12 = 28,2
  • s 22 = 19,3

Erstellen eines Konfidenzintervalls von Hand

Um ein Konfidenzintervall für σ 21 / σ 22 von Hand zu berechnen, geben wir einfach die Zahlen in die Konfidenzintervallformel ein:

(s 12 / s 22 ) * F n1-1, n2-1, α / 2 ≤ σ 21 / σ 22 ≤ (s 12 / s 22 ) * F n2-1, n1-1,α / 2

Die einzigen Zahlen, die uns fehlen, sind die kritischen Werte. Glücklicherweise können wir diese kritischen Werte in der F-Verteilungstabelle finden :

F n2-1, n1-1, α / 2 = F 10, 15, 0,025 = 3,0602

F n1-1, n2-1,α / 2 = 1 / F 15, 10, 0,025 = 1 / 3,5217 = 0,2839

(Klicken Sie, um die Tabelle zu vergrößern.)

F-Verteilungstabelle für Alpha = 0,025.

Jetzt können wir alle Zahlen in die Konfidenzintervallformel einfügen:

(s 12 / s 22 ) * F n1-1, n2-1, α / 2 ≤ σ 21 / σ 22 ≤ (s 12 / s 22 ) * F n2-1, n1-1,α / 2

(28,2 / 19,3) * (0,2839) ≤ σ 21 / σ 22 ≤ (28,2 / 19,3) * (3,0602)

0,4148 ≤ σ 21 / σ 22 ≤ 4,4714

Somit beträgt das 95%-Konfidenzintervall für das Verhältnis der Populationsvarianzen (0,4148, 4,4714).

Erstellen eines Konfidenzintervalls mit Excel

Das folgende Bild zeigt, wie ein 95%-Konfidenzintervall für das Verhältnis der Populationsabweichungen in Excel berechnet wird. Die unteren und oberen Grenzen des Konfidenzintervalls werden in Spalte E angezeigt, und die Formel zum Ermitteln der unteren und oberen Grenzen wird in Spalte F angezeigt:

Konfidenzintervall mit F-Verteilung in Excel

Somit beträgt das 95%-Konfidenzintervall für das Verhältnis der Populationsvarianzen (0,4148, 4,4714). Dies entspricht dem, was wir erhalten haben, als wir das Konfidenzintervall von Hand berechnet haben.

Erstellen eines Konfidenzintervalls mit R

Der folgende Code zeigt, wie ein 95%-Konfidenzintervall für das Verhältnis der Populationsvarianzen in R berechnet wird:

#Definieren Sie das Signifikanzniveau, die Stichprobengröße und die Stichprobenvarianzen
alpha <- 0,05
n1    <- 16
n2    <- 11
var1  <- 28.2
var2  <- 19.3

#Definieren Sie kritische F-Werte
upper_crit <- 1/qf(alpha/2, n1-1, n2-1)lower_crit <- qf(alpha/2, n2-1, n1-1)
lower_bound <- (var1/var2) * lower_critupper_bound <- (var1/var2) * upper_crit
paste0("(", lower_bound, ", ", upper_bound, " )")
# [1] (0,414899337980266, 4,47137571035219)

Somit beträgt das 95%-Konfidenzintervall für das Verhältnis der Populationsvarianzen (0,4148, 4,4714). Dies entspricht dem, was wir erhalten haben, als wir das Konfidenzintervall von Hand berechnet haben.

Zusätzliche Ressourcen

Lesen der F-Verteilungstabelle
So finden Sie den kritischen F-Wert in Excel

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: