So führen Sie den Levene-Test in Python durch

Von Fabian
Kategorie: Python
Lesezeit: 2 Minuten

Der Levene-Test wird verwendet, um festzustellen, ob zwei oder mehr Gruppen gleiche Varianzen aufweisen. Es wird häufig verwendet, da bei vielen statistischen Tests davon ausgegangen wird, dass Gruppen gleiche Varianzen aufweisen, und mit dem Levene-Test können Sie feststellen, ob diese Annahme erfüllt ist.

In diesem Tutorial wird erklärt, wie Sie den Levene-Test in Python durchführen.

Beispiel: Levene’s Test in Python

Die Forscher wollen wissen, ob drei verschiedene Düngemittel zu unterschiedlichem Pflanzenwachstum führen. Sie wählen zufällig 30 verschiedene Pflanzen aus und teilen sie in drei 10er-Gruppen auf, wobei sie jeder Gruppe einen anderen Dünger zuführen. Am Ende eines Monats messen sie die Höhe jeder Pflanze.

Führen Sie die folgenden Schritte aus, um den Levene-Test in Python durchzuführen und festzustellen, ob die drei Gruppen gleiche Varianzen aufweisen.

Schritt 1: Geben Sie die Daten ein.

Zuerst erstellen wir drei Arrays, die die Datenwerte enthalten:

group1 = [7, 14, 14, 13, 12, 9, 6, 14, 12, 8]
group2 = [15, 17, 13, 15, 15, 13, 9, 12, 10, 8]
group3 = [6, 8, 8, 9, 5, 14, 13, 8, 10, 9]

Schritt 2: Führen Sie den Levene-Test durch.

Als Nächstes führen wir den Levene-Test mit der Funktion levene() aus der SciPy-Bibliothek durch, die die folgende Syntax verwendet:

levene(sample1, sample2, …, center=’median’)

wo:

  • sample1, sample2 usw .: Namen der Samples.
  • median: Methode für den Levene-Test. Der Standardwert ist „Median“, aber andere Optionen sind „Mittelwert“ und „Trimmen“.

Wie in der Dokumentation erwähnt, können Sie tatsächlich drei verschiedene Varianten des Levene-Tests verwenden. Die empfohlenen Verwendungen sind wie folgt:

  • ‚median‘: Empfohlen für verzerrte (skewed) Verteilungen.
  • ‚mean‘: Empfohlen für symmetrische Verteilungen („moderate-tailed“).
  • ‚trimmed‘: Empfohlen für „heavy-tailed“ Verteilungen.

Der folgende Code zeigt, wie der Levene-Test unter Verwendung des Mittelwerts und des Medians als Zentrum durchgeführt wird:

import scipy.stats as stats

# Levenes Test zentrierte sich auf den Median
stats.levene(group1, group2, group3, center = 'median')

(statistic = 0,1798, pvalue = 0,8364)

# Levenes Test konzentrierte sich auf den Mittelwert
stats.levene(group1, group2, group3, center = 'mean') 
(statistic = 0,5357, pvalue = 0,5914)

Bei beiden Methoden beträgt der p-Wert nicht weniger als 0,05. Dies bedeutet, dass wir in beiden Fällen die Nullhypothese nicht ablehnen würden. Dies bedeutet, dass wir nicht genügend Beweise dafür haben, dass die Varianz des Pflanzenwachstums zwischen den drei Düngemitteln signifikant unterschiedlich ist.

Mit anderen Worten, die drei Gruppen haben gleiche Varianzen. Wenn wir einen statistischen Test (wie eine Einfaktorielle-ANOVA ) durchführen würden, bei dem davon ausgegangen wird, dass jede Gruppe die gleiche Varianz aufweist, wäre diese Annahme erfüllt.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: