So berechnen Sie einen Chi-Quadrat-Unabhängigkeitstest in R

Von Fabian
Kategorie: R
Lesezeit: 2 Minuten

Ein Chi-Quadrat-Unabhängigkeitstest wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen eine signifikante Assoziation besteht oder nicht.

In diesem Tutorial wird erklärt, wie ein Chi-Quadrat-Unabhängigkeitstest in R durchgeführt wird.

Beispiel: Chi-Quadrat-Unabhängigkeitstest in R

Angenommen, wir möchten wissen, ob das Geschlecht mit der Präferenz der politischen Partei zusammenhängt oder nicht. Wir nehmen eine einfache Zufallsstichprobe von 500 Wählern und befragen sie nach ihren Präferenzen für politische Parteien. Die folgende Tabelle zeigt die Ergebnisse der Umfrage:

Republican Democrat Independent Total
Male 120 90 40 250
Female 110 95 45 250
Total 230 185 85 500

Führen Sie die folgenden Schritte aus, um einen Chi-Quadrat-Unabhängigkeitstest in R durchzuführen, um festzustellen, ob das Geschlecht mit der Präferenz der politischen Partei zusammenhängt.

Schritt 1: Erstellen Sie die Daten.

Zuerst erstellen wir eine Tabelle für unsere Daten:

#Tabelle erstellen
data <- matrix(c(120, 90, 40, 110, 95, 45), ncol=3, byrow=TRUE)
colnames(data) <- c("Rep","Dem","Ind")
rownames(data) <- c("Male","Female")
data <- as.table(data)

#Tabelle anzeigen
data

       Rep Dem Ind
Male   120  90  40
Female 110  95  45

Schritt 2: Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch.

Als nächstes können wir den Chi-Quadrat-Unabhängigkeitstest mit der Funktion chisq.test() durchführen:

#Chi-Quadrat-Unabhängigkeitstest durchführen
chisq.test(data)

    Pearson's Chi-squared test

data:  data
X-squared = 0.86404, df = 2, p-value = 0.6492

Die Ausgabe kann folgendermaßen interpretiert werden:

  • Chi-Quadrat-Teststatistik: 0,86404
  • Freiheitsgrade: 2 (berechnet als # Zeilen-1 * # Spalten-1)
  • p-Wert: 0,6492

Denken Sie daran, dass der Chi-Quadrat-Unabhängigkeitstest die folgenden Null- und Alternativhypothesen verwendet:

  • H 0: (Nullhypothese) Die beiden Variablen sind unabhängig.
  • H 1: (alternative Hypothese) Die beiden Variablen sind nicht unabhängig.

Da der p-Wert (0,6492) des Tests nicht weniger als 0,05 beträgt, können wir die Nullhypothese nicht ablehnen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass ein Zusammenhang zwischen Geschlecht und Präferenz der politischen Parteien besteht.

Mit anderen Worten, Geschlecht und Präferenz der politischen Parteien sind unabhängig.

Zusätzliche Ressourcen

Eine Einführung in den Chi-Quadrat-Unabhängigkeitstest
Chi-Quadrat-Test des Unabhängigkeitsrechners

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: