Partielle Korrelation in R berechnen - so geht's

Von Fabian
Kategorie: R
Lesezeit: 3 Minuten

In der Statistik verwenden wir häufig den Pearson-Korrelationskoeffizienten, um die lineare Beziehung zwischen zwei Variablen zu messen. Manchmal sind wir jedoch daran interessiert, die Beziehung zwischen zwei Variablen zu verstehen, während wir eine dritte Variable steuern.

Angenommen, wir möchten den Zusammenhang zwischen der Anzahl der Stunden, die ein Schüler studiert, und der Punktzahl der Abschlussprüfung messen, während er die aktuelle Note des Schülers in der Klasse kontrolliert. In diesem Fall könnten wir eine partielle Korrelation verwenden, um die Beziehung zwischen den untersuchten Stunden und dem Ergebnis der Abschlussprüfung zu messen.

In diesem Tutorial wird erklärt, wie die partielle Korrelation in R berechnet wird.

Beispiel: Partielle Korrelation in R

Angenommen, wir haben das folgende Dataframe, in dem die aktuelle Note, die Gesamtstundenzahl und die Abschlussprüfung für 10 Schüler angezeigt werden:

#Dataframe erstellen
df <- data.frame(currentGrade = c(82, 88, 75, 74, 93, 97, 83, 90, 90, 80),
                 hours = c(4, 3, 6, 5, 4, 5, 8, 7, 4, 6),
                 examScore = c(88, 85, 76, 70, 92, 94, 89, 85, 90, 93))

#Dataframe anzeigen
df

   currentGrade hours examScore
1            82     4        88
2            88     3        85
3            75     6        76
4            74     5        70
5            93     4        92
6            97     5        94
7            83     8        89
8            90     7        85
9            90     4        90
10           80     6        93

Um die partielle Korrelation zwischen jeder paarweisen Kombination von Variablen im Dataframe zu berechnen, können wir die Funktion pcor() aus der ppcor-Bibliothek verwenden :

#Partielle Korrelation berechnen
pcor(df)

$estimate
             currentGrade      hours examScore
currentGrade    1.0000000 -0.3112341 0.7355673
hours          -0.3112341  1.0000000 0.1906258
examScore       0.7355673  0.1906258 1.0000000

$p.value
             currentGrade     hours  examScore
currentGrade   0.00000000 0.4149353 0.02389896
hours          0.41493532 0.0000000 0.62322848
examScore      0.02389896 0.6232285 0.00000000

$statistic
             currentGrade      hours examScore
currentGrade    0.0000000 -0.8664833 2.8727185
hours          -0.8664833  0.0000000 0.5137696
examScore       2.8727185  0.5137696 0.0000000

$n
[1] 10

$gp
[1] 1

$method
[1] "pearson"

So interpretieren Sie die Ausgabe:

Partielle Korrelation zwischen den untersuchten Stunden und dem Ergebnis der Abschlussprüfung:

Die partielle Korrelation zwischen den untersuchten Stunden und dem Ergebnis der Abschlussprüfung beträgt 0,191, was eine kleine positive Korrelation darstellt. Mit zunehmenden Stunden steigt auch die Prüfungspunktzahl, vorausgesetzt, die aktuelle Note wird konstant gehalten.

Der p-Wert für diese partielle Korrelation beträgt 0,623, was bei α = 0,05 statistisch nicht signifikant ist.

Partielle Korrelation zwischen der aktuellen Note und dem Ergebnis der Abschlussprüfung:

Die partielle Korrelation zwischen der aktuellen Note und dem Ergebnis der Abschlussprüfung beträgt 0,736, was eine starke positive Korrelation darstellt. Mit zunehmender aktueller Note steigt auch die Prüfungspunktzahl, vorausgesetzt, die untersuchten Stunden werden konstant gehalten.

Der p-Wert für diese partielle Korrelation beträgt 0,024, was bei α = 0,05 statistisch signifikant ist.

Partielle Korrelation zwischen der aktuellen Note und den untersuchten Stunden:

Die partielle Korrelation zwischen der aktuellen Note und den untersuchten Stunden und dem Ergebnis der Abschlussprüfung beträgt -.311, was eine leicht negative Korrelation darstellt. Wenn die aktuelle Note steigt, nimmt die Punktzahl der Abschlussprüfung tendenziell ab, vorausgesetzt, die Punktzahl der Abschlussprüfung wird konstant gehalten.

Der p-Wert für diese partielle Korrelation beträgt 0,415, was bei α = 0,05 statistisch nicht signifikant ist.

Die Ausgabe sagt uns auch, dass die Methode zur Berechnung der Partielle Korrelation "Pearson" war. Innerhalb der Funktion pcor() könnten wir auch "kendall" oder "pearson" als alternative Methoden zur Berechnung der Korrelationen angeben.

Die vollständige Dokumentation zur ppcor-Bibliothek finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: