Ein Chi-Quadrat-Test der Unabhängigkeit wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen eine signifikante Assoziation besteht oder nicht.

In diesem Tutorial wird erklärt, wie Sie in Python einen Chi-Quadrat-Unabhängigkeitstest durchführen.

Beispiel: Chi-Quadrat-Unabhängigkeitstest in Python

Angenommen, wir möchten wissen, ob das Geschlecht mit der Präferenz der politischen Partei zusammenhängt oder nicht. Wir nehmen eine einfache Zufallsstichprobe von 500 Wählern und befragen sie nach ihren Präferenzen für politische Parteien. Die folgende Tabelle zeigt die Ergebnisse der Umfrage:

RepublikanerDemokratUnabhängigGesamt
Männlich1209040250
Weiblich1109545250
Gesamt23018585500

Führen Sie die folgenden Schritte aus, um in Python einen Chi-Quadrat-Unabhängigkeitstest durchzuführen, um festzustellen, ob das Geschlecht mit der Präferenz der politischen Partei zusammenhängt.

Schritt 1: Erstellen Sie die Daten.

Zuerst erstellen wir eine Tabelle für unsere Daten:

 data = [[120, 90, 40],
        [110, 95, 45]]

Schritt 2: Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch.

Als Nächstes können wir den Chi-Quadrat-Unabhängigkeitstest mit der Funktion chi2_contingency aus der SciPy-Bibliothek durchführen, die die folgende Syntax verwendet:

chi2_contingency(observed)

wobei:

  • observed: Eine Kontingenztabelle der beobachteten Werte.

Der folgende Code zeigt, wie diese Funktion in unserem speziellen Beispiel verwendet wird:

 import scipy.stats as stats

# Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch
stats.chi2_contingency(data)

(0,864,
 0,649,
 2,
 Array ([[115., 92,5, 42,5],
        [115. 92,5, 42,5]]))

Die Interpretation der Ausgabe ist wie folgt:

  • Chi-Quadrat-Teststatistik: 0,864
  • p-Wert: 0,649
  • Freiheitsgrade: 2 (berechnet als #Zeilen-1 * # Spalten-1)
  • Array: Das letzte Array zeigt die erwarteten Werte für jede Zelle in der Kontingenztabelle an.

Denken Sie daran, dass der Chi-Quadrat-Unabhängigkeitstest die folgenden Null- und Alternativhypothesen verwendet:

  • H0: (Nullhypothese) Die beiden Variablen sind unabhängig.
  • H1: (alternative Hypothese) Die beiden Variablen sind nicht unabhängig.

Da der p-Wert (.649) des Tests nicht weniger als 0,05 beträgt, können wir die Nullhypothese nicht ablehnen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass ein Zusammenhang zwischen Geschlecht und Präferenz der politischen Parteien besteht.

Mit anderen Worten, Geschlecht und Präferenz der politischen Parteien sind unabhängig.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren:
Rechner

Phi-Koeffizient-Rechner

    Ein Phi-Koeffizient ist ein Maß für die Assoziation zwischen zwei binären Variablen.

    Um den Phi-Koeffizienten für eine 2 × 2-Tabelle mit zwei Zufallsvariablen zu berechnen, füllen Sie einfach die Zellen der …