So berechnen die Punktbiseriale Korrelation in R

Von Fabian
Kategorie: R
Lesezeit: 2 Minuten

Die Punktbiseriale Korrelation wird verwendet, um die Beziehung zwischen einer binären Variablen x und einer kontinuierlichen Variablen y zu messen.

Ähnlich wie der Pearson-Korrelationskoeffizient nimmt der Punktbiseriale Korrelationskoeffizient einen Wert zwischen -1 und 1 an, wobei:

  • -1 zeigt eine vollkommen negative Korrelation zwischen zwei Variablen an
  • 0 zeigt keine Korrelation zwischen zwei Variablen an
  • 1 zeigt eine vollkommen positive Korrelation zwischen zwei Variablen an

In diesem Tutorial wird erklärt, wie die Punktbiseriale Korrelation zwischen zwei Variablen in R berechnet wird.

Beispiel: Punktbiseriale Korrelation in R

Angenommen, wir haben eine binäre Variable x und eine stetige Variable y:

x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0)

y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)

Wir können die eingebaute R-Funktion cor.test() verwenden, um die Punktbiseriale Korrelation zwischen den beiden Variablen zu berechnen:

#Punktbiseriale Korrelation berechnen
cor.test(x, y)

#Output

    Pearson's product-moment correlation

data:  x and y
t = 0.67064, df = 9, p-value = 0.5193

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:
 -0.4391885  0.7233704

sample estimates:
      cor 
0.2181635 

Aus der Ausgabe können wir Folgendes beobachten:

  • Der Punktbiseriale Korrelationskoeffizient beträgt 0,218
  • Der entsprechende p-Wert beträgt 0,5193

Da der Korrelationskoeffizient positiv ist, zeigt dies an, dass die Variable y tendenziell höhere Werte annimmt, wenn die Variable x den Wert "1" annimmt, als wenn die Variable x den Wert "0" annimmt.

Da der p-Wert dieser Korrelation jedoch nicht kleiner als 0,05 ist, ist diese Korrelation statistisch nicht signifikant.

Beachten Sie, dass die Ausgabe auch ein 95%-Konfidenzintervall für den wahren Korrelationskoeffizienten bereitstellt, das sich wie folgt herausstellt:

95% CI = (-0,439, 0,723)

Da dieses Konfidenzintervall Null enthält, ist dies ein weiterer Beweis dafür, dass der Korrelationskoeffizient statistisch nicht signifikant ist.

Die vollständige Dokumentation zur Funktion cor.test() finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: