So führen Sie eine ANCOVA in Python durch

Von Fabian
Kategorie: Python
Tags: ANOVA
Lesezeit: 2 Minuten

Eine ANCOVA ("Analyse der Kovarianz") wird verwendet, um zu bestimmen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen gibt, nachdem eine oder mehrere Kovariaten kontrolliert wurden.

In diesem Tutorial wird erklärt, wie eine ANCOVA in Python durchgeführt wird.

Beispiel: ANCOVA in Python

Eine Lehrerin möchte wissen, ob drei verschiedene Lerntechniken einen Einfluss auf die Prüfungsergebnisse haben, aber sie möchte die aktuelle Note berücksichtigen, die der Schüler bereits in der Klasse hat.

Sie führt eine ANCOVA mit den folgenden Variablen durch:

  • Faktorvariable: Lerntechnik
  • Covariate: aktuelle Note
  • Antwortvariable: Prüfungsergebnis

Führen Sie die folgenden Schritte aus, um eine ANCOVA für diesen Datensatz durchzuführen:

Schritt 1: Geben Sie die Daten ein.

Zuerst erstellen wir einen Pandas DataFrame, um unsere Daten zu speichern:

import numpy as np
import pandas as pd

# Daten erstellen
df = pd.DataFrame({'technique': np.repeat(['A', 'B', 'C'], 5),
                   'current_grade': [67, 88, 75, 77, 85,
                                     92, 69, 77, 74, 88, 
                                     96, 91, 88, 82, 80],
                   'exam_score': [77, 89, 72, 74, 69,
                                  78, 88, 93, 94, 90,
                                  85, 81, 83, 88, 79]})

#Daten anzeigen 
df

  technique current_grade   exam_score
0      A               67           77
1        A             88           89
2        A             75           72
3        A             77           74
4        A             85           69
5        B             92           78
6        B             69           88
7        B             77           93
8        B             74           94
9        B             88           90
10     C               96           85
11     C               91           81
12     C               88           83
13     C               82           88
14     C               80           79

Schritt 2: Führen Sie die ANCOVA durch.

Als nächstes führen wir eine ANCOVA mit der Funktion ancova() aus der pingouin-Bibliothek durch:

pip install pingouin 
from pingouin import ancova

# ANCOVA durchführen
ancova(data=df, dv='exam_score', covar='current_grade', between='technique')


  Source            SS            DF    F          p-unc      np2
0   technique         390.575130     2  4.80997  0.03155    0.46653
1   current_grade     4.193886     1    0.10329  0.75393    0.00930
2   Residual          446.606114    11      NaN      NaN        NaN

Schritt 3: Interpretieren Sie die Ergebnisse.

Aus der ANCOVA-Tabelle geht hervor, dass der p-Wert (p-unc = „unkorrigierter p-Wert“) für die Studientechnik 0,03155 beträgt. Da dieser Wert weniger als 0,05 beträgt, können wir die Nullhypothese ablehnen, dass jede der Lerntechniken zu derselben durchschnittlichen Prüfungspunktzahl führt, selbst nachdem die aktuelle Note des Schülers in der Klasse berücksichtigt wurde.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: