So führen Sie eine zweifaktorielle ANOVA von Hand durch

Von Fabian
Kategorie: Grundlegendes
Tags: ANOVA
Lesezeit: 6 Minuten

Eine zweifaktorielle ANOVA wird verwendet, um zu bestimmen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen gibt, die auf zwei Faktoren aufgeteilt wurden.

Dieses Tutorial erklärt, wie man eine zweifaktorielle ANOVA von Hand durchführt.

Beispiel: Zwei-Wege-ANOVA von Hand

Angenommen, ein Botaniker möchte wissen, ob das Pflanzenwachstum durch die Sonneneinstrahlung und die Bewässerungshäufigkeit beeinflusst wird. Sie pflanzt 40 Samen und lässt sie einen Monat lang unter verschiedenen Bedingungen für Sonneneinstrahlung und Bewässerungshäufigkeit wachsen.

Nach einem Monat zeichnet sie die Höhe jeder Pflanze auf. Die Ergebnisse sind unten aufgeführt:

Zwei-Wege-ANOVA-Tabelle in Excel

In der obigen Tabelle sehen wir, dass fünf Pflanzen unter jeder Kombination von Bedingungen angebaut wurden.

Zum Beispiel wurden fünf Pflanzen mit täglicher Bewässerung und ohne Sonnenlicht angebaut und ihre Höhe nach zwei Monaten betrug 4,8 Zoll, 4,4 Zoll, 3,2 Zoll, 3,9 Zoll und 4,4 Zoll:

zweifaktorielle ANOVA-Daten in Excel

Wir können die folgenden Schritte verwenden, um eine zweifaktorielle ANOVA durchzuführen:

Schritt 1: Berechnen der Quadratsumme für den ersten Faktor (Bewässerungsfrequenz)

Zuerst berechnen wir die Gesamthöhe aller 40 Pflanzen:

Großer Mittelwert = (4,8 + 5 + 6,4 + 6,3 + … + 3,9 + 4,8 + 5,5 + 5,5) / 40 = 5,1525

Als nächstes berechnen wir die mittlere Höhe aller täglich bewässerten Pflanzen:

Tagesmittel = (4,8 + 5 + 6,4 + 6,3 + … + 4,4 + 4,8 + 5,8 + 5,8) /20 = 5,155

Als nächstes berechnen wir die mittlere Höhe aller wöchentlich bewässerten Pflanzen:

Wöchentliches Mittel = (4,4 + 4,9 + 5,8 + 6 + … + 3,9 + 4,8 + 5,5 + 5,5) /20 = 5,15

Als nächstes berechnen wir die Quadratsumme für den Faktor „Bewässerungshäufigkeit“ mit der folgenden Formel:

n(X j – X ..) 2

wo:

  • n: die Stichprobengröße der Gruppe j
  • Σ: ein griechisches Symbol, das „Summe“ bedeutet
  • X j: Mittelwert der Gruppe j
  • X ..: das große Mittel

In unserem Beispiel berechnen wir die Quadratsumme für den Faktor „Bewässerungshäufigkeit“ zu: 20(5.155-5.1525) 2 + 20(5.15-5.1525) 2 = .00025

Schritt 2: Berechnen der Quadratsumme für den zweiten Faktor (Sonneneinstrahlung)

Zuerst berechnen wir die Gesamthöhe aller 40 Pflanzen:

Großer Mittelwert = (4,8 + 5 + 6,4 + 6,3 + … + 3,9 + 4,8 + 5,5 + 5,5) / 40 = 5,1525

Als nächstes berechnen wir die mittlere Höhe aller Pflanzen ohne Sonneneinstrahlung:

Mittel ohne Sonnenlicht = (4,8 + 4,4 + 3,2 + 3,9 + 4,4 + 4,4 + 4,2 + 3,8 + 3,7 + 3,9) / 10 = 4,07

Wir wiederholen diese Berechnung, um die durchschnittliche Höhe von Pflanzen mit unterschiedlicher Sonneneinstrahlung zu ermitteln:

  • Mittelwert der niedrigen Sonneneinstrahlung = 5,1
  • Mittleres Sonnenlicht = 5,89
  • Mittleres Sonnenlicht = 5,55

Als nächstes berechnen wir die Quadratsumme für den Faktor „Sonnenlichtexposition“ mit der folgenden Formel:

Σn(X j – X ..) 2

wo:

  • n: die Stichprobengröße der Gruppe j
  • Σ: ein griechisches Symbol, das „Summe“ bedeutet
  • X j: Mittelwert der Gruppe j
  • X ..: das große Mittel

In unserem Beispiel berechnen wir die Quadratsumme für den Faktor „Sonnenlichtexposition“ zu: 10(4,07–5,1525) 2 + 10(5,1–5,1525) 2 + 10(5,89–5,1525) 2 + 10(5,55–5,1525) 2 = 18,76475

Schritt 3: Berechnen Sie die Summe der Quadrate innerhalb (Fehler)

Als nächstes berechnen wir die Summe der Quadrate innerhalb, indem wir die Summe der quadrierten Differenzen zwischen jeder Kombination von Faktoren und den einzelnen Pflanzenhöhen nehmen.

Zum Beispiel beträgt die durchschnittliche Höhe aller Pflanzen, die täglich ohne Sonneneinstrahlung bewässert werden, 4,14. Wir können dann die Summe der quadrierten Differenzen für jede dieser einzelnen Pflanzen berechnen als:

  • SS für tägliche Bewässerung und kein Sonnenlicht: (4,8-4.14) 2 + (4.4-4.14) 2 + (3.2-4.14) 2 + (3.9-4.14) 2 + (4.4-4.14) 2 = 1.512

Wir können diesen Vorgang für jede Kombination von Faktoren wiederholen:

  • SS für tägliche Bewässerung und geringe Sonneneinstrahlung: 0,928
  • SS für tägliche Bewässerung und mittleres Sonnenlicht: 1.788
  • SS für tägliche Bewässerung und hohe Sonneneinstrahlung: 1,648
  • SS für wöchentliches Gießen und kein Sonnenlicht: 0,34
  • SS für wöchentliches Gießen und wenig Sonnenlicht: 0.548
  • SS für wöchentliche Bewässerung und mittlere Sonneneinstrahlung: 0,652
  • SS für wöchentliche Bewässerung und hohe Sonneneinstrahlung: 1.268

Wir können dann die Summe all dieser Werte nehmen, um die Summe der Quadrate darin zu finden (Fehler):

Quadratsummen innerhalb = 1.512 + .928 + 1.788 + 1.648 + .34 + .548 + .652 + 1.268 = 8.684

Schritt 4: Gesamtsumme der Quadrate berechnen

Als nächstes können wir die Gesamtsumme der Quadrate berechnen, indem wir die Summe der Differenzen zwischen jeder einzelnen Pflanzenhöhe und dem Gesamtmittelwert bilden:

Gesamtsumme der Quadrate = (4,8 – 5,1525) 2 + (5 – 5,1525) 2 + … + (5,5 – 5,1525) 2 = 28.45975

Schritt 5: Berechnen Sie die Summe der Quadrate-Interaktion

Als nächstes berechnen wir die Summe der Quadrate Wechselwirkung mit der folgenden Formel:

  • SS-Interaktion = SS-Gesamt – SS-Faktor 1 – SS-Faktor 2 – SS innerhalb
  • SS-Interaktion = 28.45975 – .00025 – 18.76475 – 8.684
  • SS-Interaktion = 1.01075

Schritt 6: ANOVA-Tabelle ausfüllen

Zuletzt tragen wir die Werte für die zweifaktorielle ANOVA-Tabelle ein:

Zwei-Wege-Hand

So haben wir die verschiedenen Zahlen in der Tabelle berechnet:

  • df Bewässerungsfrequenz: j-1 = 2-1 = 1
  • df Sonneneinstrahlung: k-1 = 4-1 = 3
  • df Wechselwirkung: (j-1)*(k-1) = 1*3 = 3
  • df Innerhalb: n – (j*k) = 40 – (2*4) = 32
  • df gesamt: n-1 = 40-1 = 39
  • MS: SS/ df
  • F Bewässerungshäufigkeit: MS-Bewässerungshäufigkeit / MS innerhalb
  • F Sonnenlichtexposition: MS Sonnenlichtexposition / MS innerhalb
  • F Interaktion: MS Interaktion / MS innerhalb
  • p-Wert Bewässerungshäufigkeit: Der p-Wert, der dem F-Wert von 0,000921 mit df-Zähler = 1 und df-Nenner = 32 . entspricht
  • p-Wert Sonneneinstrahlung: Der p-Wert, der dem F-Wert von 23.04898 mit df-Zähler = 3 und df-Nenner = 32 . entspricht
  • p-Wert-Interaktion: Der p-Wert, der dem F-Wert von 1,241517 mit df-Zähler = 3 und df-Nenner = 32 . entspricht

Anmerkung 1: n = Gesamtbeobachtungen, j = Anzahl der Stufen für die Bewässerungshäufigkeit, k = Anzahl der Stufen für die Sonneneinstrahlung.

Hinweis #2: Die dem F-Wert entsprechenden p-Werte wurden mit dem F-Verteilungsrechner berechnet.

Schritt 7: Interpretieren Sie die Ergebnisse

Aus der ANOVA-Tabelle können wir Folgendes beobachten:

  • Der p-Wert für die Wechselwirkung zwischen Bewässerungshäufigkeit und Sonneneinstrahlung betrug 0,311. Dies ist bei α = 0,05 statistisch nicht signifikant.
  • Der p-Wert für die Bewässerungshäufigkeit betrug 0,975. Dies ist bei α = 0,05 statistisch nicht signifikant.
  • Der p-Wert für die Sonneneinstrahlung war < 0,000. Dies ist bei α = 0,05 statistisch signifikant.

Diese Ergebnisse zeigen, dass die Sonneneinstrahlung der einzige Faktor ist, der einen statistisch signifikanten Einfluss auf die Pflanzenhöhe hat.

Und da es keinen Interaktionseffekt gibt, ist die Wirkung der Sonneneinstrahlung über jede Bewässerungsfrequenz hinweg konsistent.

Das heißt, ob eine Pflanze täglich oder wöchentlich bewässert wird, hat keinen Einfluss darauf, wie sich die Sonneneinstrahlung auf die Pflanze auswirkt.

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zu ANOVAs:

So führen Sie eine einfaktorielle ANOVA von Hand durch
So führen Sie eine ANOVA mit wiederholten Messungen von Hand durch

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: