So führen Sie eine einfaktorielle ANOVA von Hand durch

Von Fabian
Kategorie: Tutorials
Tags: ANOVA
Lesezeit: 4 Minuten

Eine einfaktorielle ANOVA („Varianzanalyse“) vergleicht die Mittelwerte von drei oder mehr unabhängigen Gruppen, um festzustellen, ob zwischen den entsprechenden Populationsmitteln ein statistisch signifikanter Unterschied besteht.

In diesem Tutorial wird erklärt, wie eine einfaktorielle ANOVA von Hand durchgeführt wird.

Beispiel: einfaktorielle ANOVA von Hand

Angenommen, wir möchten wissen, ob drei verschiedene Prüfungsvorbereitungsprogramme bei einer bestimmten Prüfung zu unterschiedlichen Durchschnittswerten führen. Um dies zu testen, rekrutieren wir 30 Studenten, um an einer Studie teilzunehmen, und teilen sie in drei Gruppen auf. Die Schüler jeder Gruppe werden nach dem Zufallsprinzip ausgewählt, eines der drei Prüfungsvorbereitungsprogramme für die nächsten drei Wochen zur Vorbereitung auf eine Prüfung zu verwenden. Am Ende der drei Wochen legen alle Schüler die gleiche Prüfung ab.

Die Prüfungsergebnisse für jede Gruppe sind nachstehend aufgeführt:

Beispiel einfaktorielle ANOVA-Daten

Führen Sie die folgenden Schritte aus, um eine einfaktorielle ANOVA von Hand durchzuführen und festzustellen, ob die durchschnittliche Prüfungspunktzahl zwischen den drei Gruppen unterschiedlich ist:

Schritt 1: Berechnen Sie den Gruppenmittelwert und den Gesamtmittelwert.

Zunächst berechnen wir den Mittelwert für alle drei Gruppen zusammen mit dem Gesamtmittelwert:

ANOVA von Hand

Schritt 2: SSR berechnen.

Als nächstes berechnen wir die Regressionssumme der Quadrate (SSR) unter Verwendung der folgenden Formel:

nΣ (X j – X ..) 2

wo:

  • n: die Stichprobengröße der Gruppe j
  • Σ: ein griechisches Symbol, das „Summe“ bedeutet
  • X j: der Mittelwert der Gruppe j
  • X ..: der Gesamtmittelwert

In unserem Beispiel berechnen wir, dass SSR = 10 (83,4-85,8) 2 + 10 (89,3-85,8) 2 + 10 (84,7-85,8) 2 = 192,2

Schritt 3: Berechnen Sie die SSE.

Als nächstes berechnen wir die Fehlersumme der Quadrate (SSE) mit der folgenden Formel:

Σ (X ij – X j ) 2

wo:

  • Σ: ein griechisches Symbol, das „Summe“ bedeutet
  • X ij: die i-te Beobachtung in Gruppe j
  • X j: der Mittelwert der Gruppe j

In unserem Beispiel berechnen wir SSE wie folgt:

Gruppe 1: (85-83,4) 2 + (86-83,4) 2 + (88-83,4) 2 + (75-83,4) 2 + (78-83,4) 2 + (94-83,4) 2 + (98-83,4) 2 + (79-83,4) 2 + (71-83,4) 2 + (80-83,4) 2 = 640,4

Gruppe 2: (91-89,3) 2 + (92-89,3) 2 + (93-89,3) 2 + (85-89,3) 2 + (87-89,3) 2 + (84-89,3) 2 + (82-89,3) 2 + (88-89,3) 2 + (95-89,3) 2 + (96-89,3) 2 = 208,1

Gruppe 3: (79-84,7) 2 + (78-84,7) 2 + (88-84,7) 2 + (94-84,7) 2 + (92-84,7) 2 + (85-84,7) 2 + (83-84,7) 2 + (85-84,7) 2 + (82-84,7) 2 + (81-84,7) 2 = 252,1

SSE: 640,4 + 208,1 + 252,1 = 1100,6

Schritt 4: Berechnen Sie den SST.

Als nächstes berechnen wir die Gesamtsumme der Quadrate (SST) nach folgender Formel:

SST = SSR + SSE

In unserem Beispiel ist SST = 192,2 + 1100,6 = 1292,8

Schritt 5: Füllen Sie die ANOVA-Tabelle aus.

Nachdem wir nun SSR, SSE und SST haben, können wir die ANOVA-Tabelle ausfüllen:

QuelleSumme der Quadrate (SS)dfMittlere Quadrate (MS)F.
Behandlung192.2296.12,358
Error1100.62740.8
Gesamt1292.829

So haben wir die verschiedenen Zahlen in der Tabelle berechnet:

  • df Behandlung: k-1 = 3-1 = 2
  • df Fehler: nk = 30-3 = 27
  • df gesamt: n-1 = 30-1 = 29
  • MS-Behandlung: SST / df-Behandlung = 192,2 / 2 = 96,1
  • MS-Fehler: SSE / df-Fehler = 1100,6 / 27 = 40,8
  • F: MS-Behandlung / MS-Fehler = 96,1 / 40,8 = 2,358

Anmerkung: n = Gesamtbeobachtungen, k = Anzahl der Gruppen

Schritt 6: Interpretieren Sie die Ergebnisse.

Die F-Teststatistik für diese einfaktorielle ANOVA beträgt 2,358. Um festzustellen, ob dies ein statistisch signifikantes Ergebnis ist, müssen wir dies mit dem F-kritischen Wert in der F-Verteilungstabelle mit den folgenden Werten vergleichen:

  • α (Signifikanzniveau) = 0,05
  • DF1 (Zählerfreiheitsgrade) = df Behandlung = 2
  • DF2 (Nennerfreiheitsgrade) = df Fehler = 27

Wir finden, dass der kritische F-Wert 3,3541 beträgt.

Da die F-Teststatistik in der ANOVA-Tabelle kleiner als der F-kritische Wert in der F-Verteilungstabelle ist, können wir die Nullhypothese nicht ablehnen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass es einen statistisch signifikanten Unterschied zwischen den mittleren Prüfungsergebnissen der drei Gruppen gibt.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: