Chi-Quadrat-Anpassungstest in R durchführen - so geht's

Von Fabian
Kategorie: R
Lesezeit: 2 Minuten

Ein Chi-Quadrat-Anpassungstest wird verwendet, um zu bestimmen, ob eine kategoriale Variable einer hypothetischen Verteilung folgt oder nicht.

In diesem Tutorial wird erklärt, wie ein Chi-Quadrat-Anpassungstest in R durchgeführt wird.

Beispiel: Chi-Quadrat-Anpassungstest in R

Ein Ladenbesitzer behauptet, dass an jedem Wochentag eine gleiche Anzahl von Kunden in seinen Laden kommt. Um diese Hypothese zu testen, zeichnet ein Forscher die Anzahl der Kunden auf, die in einer bestimmten Woche in den Shop kommen, und stellt Folgendes fest:

  • Montag: 50 Kunden
  • Dienstag: 60 Kunden
  • Mittwoch: 40 Kunden
  • Donnerstag: 47 Kunden
  • Freitag: 53 Kunden

Führen Sie die folgenden Schritte aus, um einen Chi-Quadrat-Anpassungstest in R durchzuführen, um festzustellen, ob die Daten mit der Behauptung des Ladenbesitzers übereinstimmen.

Schritt 1: Erstellen Sie die Daten.

Zunächst erstellen wir zwei Arrays, um unsere beobachteten Frequenzen und unseren erwarteten Kundenanteil für jeden Tag zu speichern:

observed <- c(50, 60, 40, 47, 53) 
expected <- c(.2, .2, .2, .2, .2) # muss sich zu 1 addieren

Schritt 2: Führen Sie den Chi-Quadrat-Anpassungstest durch.

Als nächstes können wir den Chi-Quadrat- Anpassungstest mit der Funktion chisq.test() durchführen, die die folgende Syntax verwendet:

chisq.test(x, p)

wo:

  • x: Ein numerischer Vektor der beobachteten Frequenzen.
  • p: Ein numerischer Vektor mit erwarteten Anteilen.

Der folgende Code zeigt, wie diese Funktion in unserem Beispiel verwendet wird:

#Chi-Quadrat-Anpassungstest durchführen
chisq.test(x=observed, p=expected)

    Chi-squared test for given probabilities

data:  observed
X-squared = 4.36, df = 4, p-value = 0.3595

Die Chi-Quadrat-Teststatistik beträgt 4,36 und der entsprechende p-Wert 0,3595.

Beachten Sie, dass der p-Wert einem Chi-Quadrat-Wert mit n-1 Freiheitsgraden (dof, engl. degrees of freedom) entspricht, wobei n die Anzahl der verschiedenen Kategorien ist. In diesem Fall ist dof = 5-1 = 4.

Sie können den Chi-Quadrat-zu-P-Wert-Rechner verwenden, um zu bestätigen, dass der p-Wert, der X 2 = 4,36 mit dof = 4 entspricht, 0,35947 beträgt.

Denken Sie daran, dass ein Chi-Quadrat-Anpassungstest die folgenden Null- und Alternativhypothesen verwendet:

  • H 0: (Nullhypothese) Eine Variable folgt einer hypothetischen Verteilung.
  • H 1: (alternative Hypothese) Eine Variable folgt keiner hypothetischen Verteilung.

Da der p-Wert (.35947) nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass sich die tatsächliche Verteilung der Kunden von der Verteilung unterscheidet, die der Ladenbesitzer behauptet hat.

Zusätzliche Ressourcen

So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in R durch

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: