Was ist der Unterschied zwischen einem t-Test und einer ANOVA?

In diesem Tutorial wird der Unterschied zwischen einem t-Test und einer ANOVA sowie der Zeitpunkt für die Verwendung der einzelnen Tests erläutert.

Grundlegendes zu jedem der Tests verstehen

Bevor wir den Unterschied zwischen einem t-Test und einer ANOVA erläutern, ist es hilfreich, zunächst die Grundlagen jedes Tests zu erläutern.

t-Test

Ein t-Test wird verwendet, um festzustellen, ob es einen statistisch signifikanten Unterschied zwischen den Mitteln zweier Gruppen gibt oder nicht. Es gibt zwei Arten von t-Tests:

1. t-Test mit unabhängigen Stichproben. Dies wird verwendet, wenn wir den Unterschied zwischen den Mitteln zweier Gruppen vergleichen möchten und die Gruppen völlig unabhängig voneinander sind.

Zum Beispiel möchten Forscher vielleicht wissen, ob Diät A oder Diät B Menschen hilft, mehr Gewicht zu verlieren. 100 zufällig zugewiesene Personen werden der Diät A zugeordnet. Weitere 100 zufällig zugewiesene Personen werden der Diät B zugeordnet. Nach drei Monaten erfassen die Forscher den Gesamtgewichtsverlust für jede Person. Um festzustellen, ob der mittlere Gewichtsverlust zwischen den beiden Gruppen signifikant unterschiedlich ist, können Forscher einen t-Test mit unabhängigen Stichproben durchführen.

2. t-Test mit gepaarten Proben. Dies wird verwendet, wenn wir den Unterschied zwischen den Mitteln zweier Gruppen vergleichen möchten und wenn jede Beobachtung in einer Gruppe mit einer Beobachtung in der anderen Gruppe gepaart werden kann.

Angenommen, 20 Schüler einer Klasse machen einen Test, studieren einen bestimmten Leitfaden und wiederholen den Test. Um den Unterschied zwischen den Ergebnissen im ersten und zweiten Test zu vergleichen, verwenden wir einen gepaarten t-Test, da für jeden Schüler das erste Testergebnis mit dem zweiten Testergebnis gepaart werden kann.

Damit ein t-Test gültige Ergebnisse liefert, sollten die folgenden Annahmen erfüllt sein:

Zufällig: Eine Zufallsstichprobe oder ein Zufallsexperiment sollte verwendet werden, um Daten für beide Stichproben zu sammeln.
Normalverteilt: Die Stichprobenverteilung ist normalverteilt oder ungefähr normalverteilt.

Wenn diese Annahmen erfüllt sind, ist es sicher, einen t-Test zu verwenden, um den Unterschied zwischen den Mitteln zweier Gruppen zu testen.

ANOVA

Eine ANOVA (Varianzanalyse) wird verwendet, um zu bestimmen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen gibt oder nicht. Die in der Praxis am häufigsten verwendeten ANOVA-Tests sind die einfaktorielle ANOVA und die zweifaktorielle ANOVA:

Einfaktorielle ANOVA: Wird verwendet, um zu testen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen gibt, wenn die Gruppen auf einen Faktor aufgeteilt werden können.

Beispiel: Sie teilen eine Klasse von 90 Schülern zufällig in drei Gruppen zu je 30 Personen auf. Jede Gruppe verwendet einen Monat lang eine andere Lerntechnik, um sich auf eine Prüfung vorzubereiten. Am Ende des Monats legen alle Schüler die gleiche Prüfung ab. Sie möchten wissen, ob sich die Lerntechnik auf die Prüfungsergebnisse auswirkt, und führen eine einfaktorielle ANOVA durch, um festzustellen, ob zwischen den Durchschnittswerten der drei Gruppen ein statistisch signifikanter Unterschied besteht.

Zweifaktorielle ANOVA: Wird verwendet, um zu testen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen gibt, wenn die Gruppen auf zwei Faktoren aufgeteilt werden können.

Beispiel: Sie möchten feststellen, ob sich das Trainingsniveau (kein Training, leichtes Training, intensives Training) und das Geschlecht (männlich, weiblich) auf den Gewichtsverlust auswirken. In diesem Fall sind die beiden Faktoren, die Sie untersuchen, Bewegung und Geschlecht, und Ihre Antwortvariable ist Gewichtsverlust (gemessen in Pfund). Sie können eine zweifaktorielle ANOVA durchführen, um festzustellen, ob sich Bewegung und Geschlecht auf den Gewichtsverlust auswirken, und um festzustellen, ob beim Gewichtsverlust eine Wechselwirkung zwischen Bewegung und Geschlecht besteht.

Damit eine ANOVA gültige Ergebnisse liefert, sollten die folgenden Annahmen erfüllt sein:

Normalverteilung – Alle Populationen, die wir untersuchen, folgen einer Normalverteilung. Wenn wir beispielsweise die Prüfungsergebnisse von drei verschiedenen Gruppen von Studenten vergleichen möchten, müssen die Prüfungsergebnisse für die erste Gruppe, die zweite Gruppe und die dritte Gruppe normal verteilt sein.
Gleiche Varianz – Die Populationsvarianzen in jeder Gruppe sind gleich oder ungefähr gleich.
Unabhängigkeit – Die Beobachtungen in jeder Gruppe müssen unabhängig voneinander sein.

Wenn diese Annahmen erfüllt sind, ist es sicher, eine ANOVA zu verwenden, um den Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen zu testen.

Die Unterschiede zwischen den einzelnen Tests verstehen

Der Hauptunterschied zwischen einem t-Test und einer ANOVA besteht darin, wie die beiden Tests ihre Teststatistik berechnen, um festzustellen, ob zwischen den Gruppen ein statistisch signifikanter Unterschied besteht.

Ein t-Test mit unabhängigen Stichproben verwendet die folgende Teststatistik:

Teststatistik t = [( x ₁ – x ₂ ) – d] / (√ s ²₁ / n ₁ + s ²₂ / n ₂ )

wobei x ₁ und x ₂ die Stichprobenmittelwerte für die Gruppen 1 und 2 sind, d die hypothetische Differenz zwischen den beiden Mittelwerten ist (häufig ist dies Null), s ₁² und s ₂² die Stichprobenvarianzen für die Gruppen 1 und 2 sind und n ₁ und n ₂ sind die Stichprobengrößen für die Gruppen 1 bzw. 2.

Ein t-Test mit gepaarten Stichproben verwendet die folgende Teststatistik:

Teststatistik t = d / (s _d / √n)

Dabei ist d die mittlere Differenz zwischen den beiden Gruppen, s _d die Standardabweichung der Unterschiede und n die Stichprobengröße für jede Gruppe (beachten Sie, dass beide Gruppen dieselbe Stichprobengröße haben).

Eine ANOVA verwendet die folgende Teststatistik:

Teststatistik F = s ²_b / s ²_w

Dabei ist s ²_b die Varianz zwischen den Stichproben und s ²_w die Varianz innerhalb der Stichprobe.

Ein t-Test misst das Verhältnis der mittleren Differenz zwischen zwei Gruppen zur Gesamtstandardabweichung der Unterschiede. Wenn dieses Verhältnis hoch genug ist, liefert es ausreichende Beweise dafür, dass es einen signifikanten Unterschied zwischen den beiden Gruppen gibt.

Eine ANOVA misst andererseits das Varianzverhältnis zwischen den Gruppen relativ zur Varianz innerhalb der Gruppen. Ähnlich wie beim t-Test liefert dieses Verhältnis, wenn es hoch genug ist, ausreichende Beweise dafür, dass nicht alle drei Gruppen den gleichen Mittelwert haben.

Ein weiterer wesentlicher Unterschied zwischen einem t-Test und einer ANOVA besteht darin, dass der t-Test Aufschluss darüber geben kann, ob zwei Gruppen den gleichen Mittelwert haben oder nicht. Eine ANOVA sagt uns andererseits, ob drei Gruppen alle den gleichen Mittelwert haben oder nicht, aber sie sagt uns nicht explizit, welche Gruppen Mittelwerte haben, die sich voneinander unterscheiden. Um herauszufinden, welche Gruppen sich voneinander unterscheiden, müssten wir Post-hoc-Tests durchführen.

Verstehen, wann welcher Test verwendet werden muss

In der Praxis, wenn wir die Mittelwerte von zwei Gruppen vergleichen wollen, verwenden wir einen t-Test. Wenn wir die Mittelwerte von drei oder mehr Gruppen vergleichen möchten, verwenden wir eine ANOVA.

Der Grund, warum wir nicht einfach mehrere t-Tests verwenden, um die Mittelwerte von drei oder mehr Gruppen zu vergleichen, ist das Verständnis der Fehlerrate vom Typ I. Angenommen, wir haben drei Gruppen, zwischen denen wir die Mittelwerte vergleichen möchten: Gruppe A, Gruppe B und Gruppe C. Sie könnten versucht sein, die folgenden drei t-Tests durchzuführen:

Ein t-Test zum Vergleich der Mittelwertdifferenz zwischen Gruppe A und Gruppe B.
Ein t-Test zum Vergleich der Mittelwertdifferenz zwischen Gruppe A und Gruppe C.
Ein t-Test zum Vergleich der Mittelwertdifferenz zwischen Gruppe B und Gruppe C.

Für jeden t-Test besteht die Möglichkeit, dass wir einen Fehler vom Typ I begehen. Dies ist die Wahrscheinlichkeit, dass wir die Nullhypothese ablehnen, wenn sie tatsächlich wahr ist. Diese Wahrscheinlichkeit beträgt typischerweise 5%. Dies bedeutet, dass sich diese Fehlerrate erhöht, wenn wir mehrere t-Tests durchführen. Beispielsweise:

Die Wahrscheinlichkeit, dass wir mit einem t-Test einen Fehler vom Typ I begehen, beträgt 1 – 0,95 = 0,05.
Die Wahrscheinlichkeit, dass wir mit zwei t-Tests einen Fehler vom Typ I begehen, beträgt 1 – (0,95 ² ) = 0,0975.
Die Wahrscheinlichkeit, dass wir mit zwei t-Tests einen Fehler vom Typ I begehen, beträgt 1 – (0,95 ³ ) = 0,1427.

Diese Fehlerrate ist unannehmbar hoch. Glücklicherweise kontrolliert eine ANOVA diese Fehler so, dass der Fehler vom Typ I nur bei 5% bleibt. Dies gibt uns die Gewissheit, dass ein statistisch signifikantes Testergebnis tatsächlich aussagekräftig ist und nicht nur ein Ergebnis, das wir durch die Durchführung vieler Tests erhalten haben. Wenn wir also verstehen wollen, ob es einen Unterschied zwischen den Mittelwerten von drei oder mehr Gruppen gibt, müssen wir eine ANOVA verwenden, damit unsere Ergebnisse statistisch gültig und zuverlässig sind.

Grundlegendes zu jedem der Tests verstehen

t-Test

ANOVA

Die Unterschiede zwischen den einzelnen Tests verstehen

Verstehen, wann welcher Test verwendet werden muss

Statistik: Der Weg zur Datenanalyse

Vollständiger Leitfaden: So interpretieren Sie ANOVA-Ergebnisse in Excel

So führen Sie eine geschachtelte ANOVA in Excel durch (Schritt für Schritt)