Cramers V ist ein Maß für die Stärke des Zusammenhangs zwischen zwei nominalen Variablen.
Es reicht von 0 bis 1, wobei:
- 0 zeigt keine Assoziation zwischen den beiden Variablen an …
Ein Chi-Quadrat-Test der Unabhängigkeit wird verwendet, um zu bestimmen, ob zwischen zwei kategorialen Variablen eine signifikante Assoziation besteht oder nicht.
In diesem Tutorial wird erklärt, wie Sie in Python einen Chi-Quadrat-Unabhängigkeitstest durchführen.
Angenommen, wir möchten wissen, ob das Geschlecht mit der Präferenz der politischen Partei zusammenhängt oder nicht. Wir nehmen eine einfache Zufallsstichprobe von 500 Wählern und befragen sie nach ihren Präferenzen für politische Parteien. Die folgende Tabelle zeigt die Ergebnisse der Umfrage:
Republikaner | Demokrat | Unabhängig | Gesamt | |
Männlich | 120 | 90 | 40 | 250 |
Weiblich | 110 | 95 | 45 | 250 |
Gesamt | 230 | 185 | 85 | 500 |
Führen Sie die folgenden Schritte aus, um in Python einen Chi-Quadrat-Unabhängigkeitstest durchzuführen, um festzustellen, ob das Geschlecht mit der Präferenz der politischen Partei zusammenhängt.
Schritt 1: Erstellen Sie die Daten.
Zuerst erstellen wir eine Tabelle für unsere Daten:
data = [[120, 90, 40],
[110, 95, 45]]
Schritt 2: Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch.
Als Nächstes können wir den Chi-Quadrat-Unabhängigkeitstest mit der Funktion chi2_contingency aus der SciPy-Bibliothek durchführen, die die folgende Syntax verwendet:
chi2_contingency(observed)
wobei:
Der folgende Code zeigt, wie diese Funktion in unserem speziellen Beispiel verwendet wird:
import scipy.stats as stats
# Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch
stats.chi2_contingency(data)
(0,864,
0,649,
2,
Array ([[115., 92,5, 42,5],
[115. 92,5, 42,5]]))
Die Interpretation der Ausgabe ist wie folgt:
Denken Sie daran, dass der Chi-Quadrat-Unabhängigkeitstest die folgenden Null- und Alternativhypothesen verwendet:
Da der p-Wert (.649) des Tests nicht weniger als 0,05 beträgt, können wir die Nullhypothese nicht ablehnen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass ein Zusammenhang zwischen Geschlecht und Präferenz der politischen Parteien besteht.
Mit anderen Worten, Geschlecht und Präferenz der politischen Parteien sind unabhängig.
Cramers V ist ein Maß für die Stärke des Zusammenhangs zwischen zwei nominalen Variablen.
Es reicht von 0 bis 1, wobei:
Ein Phi-Koeffizient ist ein Maß für die Assoziation zwischen zwei binären Variablen.
Um den Phi-Koeffizienten für eine 2 × 2-Tabelle mit zwei Zufallsvariablen zu berechnen, füllen Sie einfach die Zellen der …