So führen Sie den Scheffé-Test in R durch

Von Fabian
Kategorie: R
Tags: ANOVA
Lesezeit: 4 Minuten

Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen gibt oder nicht.

Wenn der Gesamt-p-Wert aus der ANOVA-Tabelle unter einem bestimmten Signifikanzniveau liegt, haben wir genügend Beweise, um zu sagen, dass sich mindestens eines der Mittelwerte der Gruppen von den anderen unterscheidet.

Dies sagt uns jedoch nicht, welche Gruppen sich voneinander unterscheiden. Es sagt uns einfach, dass nicht alle Gruppenmittelwerte gleich sind.

Um genau herauszufinden, welche Gruppen sich voneinander unterscheiden, müssen wir einen Post-hoc-Test durchführen, mit dem die Family Wise Error Rate gesteuert werden kann.

Einer der am häufigsten verwendeten Post-hoc-Tests ist der Scheffé-Test.

In diesem Tutorial wird erklärt, wie der Scheffé-Test in R durchgeführt wird.

Beispiel: Scheffé-Test in R

Angenommen, ein Lehrer möchte wissen, ob drei verschiedene Lerntechniken zu unterschiedlichen Prüfungsergebnissen bei den Schülern führen. Um dies zu testen, weist sie zufällig 10 Studenten zu, um jede Lerntechnik anzuwenden, und zeichnet ihre Prüfungsergebnisse auf.

Wir können die folgenden Schritte in R verwenden, um eine einfaktorielle ANOVA anzupassen, um Unterschiede in den mittleren Prüfungsergebnissen zwischen den drei Gruppen zu testen, und den Scheffé-Test verwenden, um genau zu bestimmen, welche Gruppen unterschiedlich sind.

Schritt 1: Erstellen Sie den Datensatz.

Der folgende Code zeigt, wie Sie einen Datensatz erstellen, der Prüfungsergebnisse für alle 30 Schüler enthält:

#Dataframe erstellen
data <- data.frame(technique = rep(c("tech1", "tech2", "tech3"), each = 10),
                   score = c(76, 77, 77, 81, 82, 82, 83, 84, 85, 89,
                             81, 82, 83, 83, 83, 84, 87, 90, 92, 93,
                             77, 78, 79, 88, 89, 90, 91, 95, 95, 98))

#Die ersten sechs Zeilen des Dataframes anzeigen
head(data)

  technique score
1     tech1    76
2     tech1    77
3     tech1    77
4     tech1    81
5     tech1    82
6     tech1    82

Schritt 2: Visualisieren Sie die Prüfungsergebnisse für jede Gruppe.

Der folgende Code zeigt, wie Boxplots erstellt werden, um die Verteilung der Prüfungsergebnisse für jede Gruppe zu visualisieren:

boxplot(score ~ technique,
        data = data,
        main = "Exam Scores by Studying Technique",
        xlab = "Studying Technique",
        ylab = "Exam Scores",
        col = "steelblue",
        border = "black")

Bonferroni-Korrektur in R

Schritt 3: Führen Sie eine einfaktorielle ANOVA durch.

Der folgende Code zeigt, wie eine einfaktorielle ANOVA durchgeführt wird, um Unterschiede zwischen den mittleren Prüfungsergebnissen in jeder Gruppe zu testen:

#Passen Sie das einfaktorielle ANOVA-Modell an
model <- aov(score ~ technique, data = data)

# Ansicht Modellausgabe
summary(model)

            Df Sum Sq Mean Sq F value Pr(>F)  
technique    2  211.5  105.73   3.415 0.0476 *
Residuals   27  836.0   30.96                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Da der Gesamt-p-Wert ( 0,0476 ) kleiner als 0,05 ist, ist dies ein Hinweis darauf, dass nicht jede Gruppe die gleiche durchschnittliche Prüfungspunktzahl hat.

Als nächstes werden wir den Scheffé-Test durchführen, um festzustellen, welche Gruppen unterschiedlich sind.

Schritt 4: Scheffé-Test durchführen.

Um den Scheffé-Test durchzuführen, verwenden wir die Funktion ScheffeTest() aus dem DescTools-Paket.

Der folgende Code zeigt, wie diese Funktion für unser Beispiel verwendet wird:

#DescTools-Paket laden
library(DescTools)

#Scheffé-Test durchführen
ScheffeTest(model)

  Posthoc multiple comparisons of means: Scheffe Test 
    95% family-wise confidence level

$technique
            diff      lwr.ci    upr.ci   pval    
tech2-tech1  4.2 -2.24527202 10.645272 0.2582    
tech3-tech1  6.4 -0.04527202 12.845272 0.0519 .  
tech3-tech2  2.2 -4.24527202  8.645272 0.6803    

---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Die Interpretation der Ausgabe ist wie folgt:

  • Der mittlere Unterschied in den Prüfungsergebnissen zwischen Technik 2 und Technik 1 beträgt 4,2. Der entsprechende p-Wert für die mittlere Differenz beträgt 0,2582.
  • Der mittlere Unterschied in den Prüfungsergebnissen zwischen Technik 3 und Technik 1 beträgt 6,4. Der entsprechende p-Wert für die mittlere Differenz beträgt 0,0519.
  • Der mittlere Unterschied in den Prüfungsergebnissen zwischen Technik 3 und Technik 2 beträgt 2,2. Der entsprechende p-Wert für die mittlere Differenz beträgt 0,6803.

Abhängig von dem Signifikanzniveau, für das wir uns entscheiden, sind Technik 3 und Technik 1 die einzigen zwei Gruppen, die statistisch signifikant unterschiedlich zu sein scheinen.

Zusätzliche Ressourcen

So führen Sie eine einfaktorielle ANOVA in R durch
So führen Sie den Tukey-Test in R durch
So führen Sie eine Bonferroni-Korrektur in R durch

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: