So führen Sie einen Mann-Whitney-U-Test in Python durch

Von Fabian
Kategorie: Python
Lesezeit: 3 Minuten

Ein Mann-Whitney-U-Test (manchmal auch als Wilcoxon-Rangsummen-Test bezeichnet) wird verwendet, um die Unterschiede zwischen zwei Proben zu vergleichen, wenn die Probenverteilungen nicht normal verteilt sind und die Probengrößen klein sind (n <30). Es wird als nichtparametrisches Äquivalent zum t-Test mit zwei Stichproben angesehen.

In diesem Tutorial wird erklärt, wie Sie einen Mann-Whitney-U-Test in Python durchführen.

Beispiel: Mann-Whitney-U-Test in Python

Forscher wollen wissen, ob eine Kraftstoffbehandlung zu einer Änderung des durchschnittlichen mpg eines Autos führt. Um dies zu testen, messen sie den mpg von 12 Autos mit Kraftstoffbehandlung und 12 Autos ohne Kraftstoffbehandlung.

Da die Stichprobengrößen klein sind und die Forscher vermuten, dass die Stichprobenverteilungen nicht normal verteilt sind, beschlossen sie, einen Mann-Whitney-U-Test durchzuführen, um festzustellen, ob zwischen den beiden Gruppen ein statistisch signifikanter Unterschied in der mpg besteht.

Führen Sie die folgenden Schritte aus, um einen Mann-Whitney-U-Test in Python durchzuführen.

Schritt 1: Erstellen Sie die Daten.

Zuerst erstellen wir zwei Arrays, um die mpg-Werte für jede Gruppe von Autos zu speichern:

group1 = [20, 23, 21, 25, 18, 17, 18, 24, 20, 24, 23, 19]
group2 = [24, 25, 21, 22, 23, 18, 17, 28, 24, 27, 21, 23]

Schritt 2: Führen Sie einen Mann-Whitney-U-Test durch.

Als Nächstes verwenden wir die Funktion mannwhitneyu() aus der Bibliothek scipy.stats, um einen Mann-Whitney-U-Test durchzuführen, der die folgende Syntax verwendet:

mannwhitneyu(x, y, use_continuity=True, alternative=None)

wobei:

  • x: eine Reihe von Probenbeobachtungen aus Gruppe 1
  • y: eine Reihe von Probenbeobachtungen aus Gruppe 2
  • use_continuity: Gibt an, ob eine Kontinuitätskorrektur (1/2) berücksichtigt werden soll. Standard ist True.
  • alternative: Definiert die alternative Hypothese. Die Standardeinstellung ist „Keine“, wodurch ein p-Wert berechnet wird, der halb so groß ist wie der „zweiseitige“ p-Wert. Andere Optionen sind „zweiseitig“, „kleiner“ und „größer“.

So verwenden Sie diese Funktion in unserem speziellen Beispiel:

import scipy.stats as stats

#Führen Sie den Mann-Whitney-U-Test durch
stats.mannwhitneyu(group1, group2, alternative='two-sided')
(statistic=50.0, pvalue=0.2114)

Die Teststatistik beträgt 50,0 und der entsprechende zweiseitige p-Wert beträgt 0,2114.

Schritt 3: Interpretieren Sie die Ergebnisse.

In diesem Beispiel verwendet der Mann-Whitney-U-Test die folgenden Null- und Alternativhypothesen:

H 0: Die mpg ist zwischen den beiden Gruppen gleich

H A: Die mpg ist zwischen den beiden Gruppen nicht gleich

Da der p-Wert ( 0,2114 ) nicht weniger als 0,05 beträgt, können wir die Nullhypothese nicht ablehnen. Wir haben nicht genügend Beweise, um zu sagen, dass der wahre Mittelwert mpg zwischen den beiden Gruppen unterschiedlich ist.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: