Ein Chi-Quadrat-Anpassungstest wird verwendet, um zu bestimmen, ob eine kategoriale Variable einer hypothetischen Verteilung folgt oder nicht.

In diesem Tutorial wird erklärt, wie ein Chi-Quadrat-Anpassungstest in Python durchgeführt wird.

Beispiel: Chi-Quadrat-Anpassungstest in Python

Ein Ladenbesitzer behauptet, dass an jedem Wochentag eine gleiche Anzahl von Kunden in seinen Laden kommt. Um diese Hypothese zu testen, zeichnet ein Forscher die Anzahl der Kunden auf, die in einer bestimmten Woche in den Shop kommen, und stellt Folgendes fest:

  • Montag: 50 Kunden
  • Dienstag: 60 Kunden
  • Mittwoch: 40 Kunden
  • Donnerstag: 47 Kunden
  • Freitag: 53 Kunden

Führen Sie die folgenden Schritte aus, um einen Chi-Quadrat-Anpassungstest in Python durchzuführen und festzustellen, ob die Daten mit den Angaben des Ladenbesitzers übereinstimmen.

Schritt 1: Erstellen Sie die Daten.

Zunächst erstellen wir zwei Arrays, um unsere beobachtete und erwartete Anzahl von Kunden für jeden Tag zu speichern:

expected = [50, 50, 50, 50, 50]
observed = [50, 60, 40, 47, 53]

Schritt 2: Führen Sie den Chi-Quadrat-Anpassungstest durch.

Als nächstes können wir den Chi-Quadrat-Anpassungstest mit der chisquare-Funktion aus der SciPy-Bibliothek durchführen, die die folgende Syntax verwendet:

chisquare(f_obs, f_exp)

wobei:

  • f_obs: Ein Array von beobachteten Zählungen.
  • f_exp: Ein Array mit erwarteten Zählwerten. Standardmäßig wird angenommen, dass jede Kategorie gleich wahrscheinlich ist.

Der folgende Code zeigt, wie diese Funktion in unserem speziellen Beispiel verwendet wird:

import scipy.stats as stats

#Chi-Quadrat-Anpassungstest durchführen
stats.chisquare(f_obs=observed, f_exp=expected)
(statistic=4.36, pvalue=0.35947)

Die Chi-Quadrat-Teststatistik beträgt 4,36 und der entsprechende p-Wert 0,35947.

Beachten Sie, dass der p-Wert einem Chi-Quadrat-Wert mit n-1 Freiheitsgraden (dof) entspricht, wobei n die Anzahl der verschiedenen Kategorien ist. In diesem Fall ist dof = 5-1 = 4.

Denken Sie daran, dass ein Chi-Quadrat-Anpassungstest die folgenden Null- und Alternativhypothesen verwendet:

  • H 0: (Nullhypothese) Eine Variable folgt einer hypothetischen Verteilung.
  • H 1: (alternative Hypothese) Eine Variable folgt keiner hypothetischen Verteilung.

Da der p-Wert (.35947) nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass sich die tatsächliche Verteilung der Kunden von der Verteilung unterscheidet, die der Ladenbesitzer behauptet hat.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren:
Rechner

Phi-Koeffizient-Rechner

    Ein Phi-Koeffizient ist ein Maß für die Assoziation zwischen zwei binären Variablen.

    Um den Phi-Koeffizienten für eine 2 × 2-Tabelle mit zwei Zufallsvariablen zu berechnen, füllen Sie einfach die Zellen der …