So führen Sie einen Zweistichproben-t-Test in Python durch

Von Fabian
Kategorie: Python
Lesezeit: 3 Minuten

Ein Zweistichproben-t-Test wird verwendet, um zu testen, ob die Mittelwerte von zwei Populationen gleich sind oder nicht.

In diesem Tutorial wird erklärt, wie Sie einen Zweistichproben-t-Test in Python durchführen.

Beispiel: Zweistichproben-t-Test in Python

Die Forscher wollen wissen, ob zwei verschiedene Pflanzenarten die gleiche mittlere Höhe haben oder nicht. Um dies zu testen, sammeln sie eine einfache Zufallsstichprobe von 20 Pflanzen von jeder Art.

Führen Sie die folgenden Schritte aus, um einen T-Test mit zwei Proben durchzuführen, um festzustellen, ob die beiden Pflanzenarten dieselbe Höhe haben.

Schritt 1: Erstellen Sie die Daten.

Zuerst erstellen wir zwei Arrays, um die Messungen jeder Gruppe von 20 Pflanzen zu speichern:

import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

Schritt 2: Führen Sie einen T-Test mit zwei Proben durch.

Als Nächstes verwenden wir die Funktion ttest_ind() aus der Bibliothek scipy.stats, um einen Zweistichproben-t-Test durchzuführen, der die folgende Syntax verwendet:

ttest_ind(a, b, equal_var=True)

wobei:

  • a: eine Reihe von Probenbeobachtungen für Gruppe 1
  • b: eine Reihe von Probenbeobachtungen für Gruppe 2
  • equal_var: Wenn True, führen Sie einen standardmäßigen unabhängigen 2-Stichproben-T-Test durch, bei dem gleiche Populationsabweichungen angenommen werden. Wenn False, führen Sie den Welch-Test durch, bei dem keine gleichen Populationsabweichungen angenommen werden. Dies ist standardmäßig True.

Bevor wir den Test durchführen, müssen wir entscheiden, ob wir davon ausgehen, dass die beiden Populationen gleiche Varianzen aufweisen oder nicht. Als Faustregel können wir annehmen, dass die Populationen gleiche Varianzen aufweisen, wenn das Verhältnis der größeren Stichprobenvarianz zur kleineren Stichprobenvarianz weniger als 4: 1 beträgt.

#Varianz für jede Gruppe finden
print(np.var(group1), np.var(group2))
7.73 12.26

Das Verhältnis der größeren Stichprobenvarianz zur kleineren Stichprobenvarianz beträgt 12,26 / 7,73 = 1,586, was weniger als 4 ist. Dies bedeutet, dass wir davon ausgehen können, dass die Populationsvarianzen gleich sind.

Somit können wir fortfahren, den Zweistichproben-t-Test mit gleichen Varianzen durchzuführen:

import scipy.stats as stats

#Führen Sie Zweistichproben-T-Tests mit gleichen Varianzen durch
stats.ttest_ind(a=group1, b=group2, equal_var=True)
(statistic=-0.6337, pvalue=0.53005)

Die t-Teststatistik beträgt -0,6337 und der entsprechende zweiseitige p-Wert beträgt 0,53005.

Schritt 3: Interpretieren Sie die Ergebnisse.

Die zwei Hypothesen für diesen speziellen Zweistichproben-t-Test lauten wie folgt:

H 0: µ 1 = µ 2 (die beiden Populationsmittelwerte sind gleich)

H A: µ 1 ≠ µ 2 (die beiden Populationsmittelwerte sind nicht gleich)

Da der p-Wert unseres Tests (0,53005) größer als Alpha = 0,05 ist, können wir die Nullhypothese des Tests nicht ablehnen. Wir haben nicht genügend Beweise, um zu sagen, dass die mittlere Höhe der Pflanzen zwischen den beiden Populationen unterschiedlich ist.

Zusätzliche Ressourcen Einstichproben-t-Test in Python – so geht’s

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: