So führen Sie einen F-Test in Python durch

Von Fabian
Kategorie: Python
Lesezeit: 2 Minuten

Ein F-Test wird verwendet, um zu testen, ob zwei Populationsvarianzen gleich sind. Die Null- und Alternativhypothesen für den Test lauten wie folgt:

H 0: σ 1 2 = σ 2 2 (die Populationsvarianzen sind gleich)

H 1: σ 1 2 ≠ σ 2 2 (die Populationsvarianzen sind nicht gleich)

In diesem Tutorial wird erklärt, wie Sie einen F-Test in Python durchführen.

Beispiel: F-Test in Python

Angenommen, wir haben die folgenden zwei Beispiele:

x = [18, 19, 22, 25, 27, 28, 41, 45, 51, 55]
y = [14, 15, 15, 17, 18, 22, 25, 25, 27, 34]

Mit der folgenden Funktion können wir einen F-Test durchführen, um festzustellen, ob die beiden Populationen, aus denen diese Proben stammen, gleiche Varianzen aufweisen:

import numpy as np

# F-Test-Funktion definieren
def f_test(x, y):
    x = np.array(x)
    y = np.array(y)
    f = np.var(x, ddof=1)/np.var(y, ddof=1) #F-Test-Statistik berechnen
    dfn = x.size-1 #Freiheitsgrade Zähler definieren
    dfd = y.size-1 #Freiheitsgrade Nenner definieren
    p = 1-scipy.stats.f.cdf(f, dfn, dfd) #P-Wert der F-Statistik finden
    return f, p

# F-Test durchführen
f_test(x, y)

(4.38712, 0.019127)

Die F-Teststatistik ist 4,38712 und der entsprechende p-Wert ist 0,019127. Da dieser p-Wert kleiner als 0,05 ist, würden wir die Nullhypothese ablehnen. Dies bedeutet, dass wir genügend Beweise haben, um zu sagen, dass die beiden Populationsvarianzen nicht gleich sind.

Anmerkungen

  • Die F-Teststatistik wird als s 1 2 / s 2 2 berechnet. Standardmäßig berechnet numpy.var die Populationsvarianz. Um die Stichprobenvarianz zu berechnen, müssen wir ddof = 1 angeben.
  • Der p-Wert entspricht 1 - cdf der F-Verteilung mit Zählerfreiheitsgraden = n 1 -1 und Nennerfreiheitsgraden = n 2 -1.
  • Diese Funktion funktioniert nur, wenn die erste Stichprobenvarianz größer als die zweite Stichprobenvarianz ist. Definieren Sie daher die beiden Beispiele so, dass sie mit der Funktion arbeiten.

Wann ist der F-Test zu verwenden?

Der F-Test wird normalerweise verwendet, um eine der folgenden Fragen zu beantworten:

1. Kommen zwei Proben aus Populationen mit gleichen Varianzen?

2. Reduziert eine neue Behandlung oder ein neuer Prozess die Variabilität einer aktuellen Behandlung oder eines aktuellen Prozesses?

Verwandt: So führen Sie einen F-Test in R durch

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: