Ein Chi-Quadrat-Unabhängigkeitstest wird verwendet, um festzustellen, ob zwischen zwei kategorialen Variablen eine signifikante Assoziation besteht oder nicht.

In diesem Tutorial wird erklärt, wie ein Chi-Quadrat-Unabhängigkeitstest in Stata durchgeführt wird.

Beispiel: Chi-Quadrat-Unabhängigkeitstest in Stata

In diesem Beispiel verwenden wir einen Datensatz namens auto, der Informationen zu 74 verschiedenen Automobilen aus dem Jahr 1978 enthält.

Führen Sie die folgenden Schritte aus, um einen Chi-Quadrat-Unabhängigkeitstest durchzuführen und festzustellen, ob zwischen den folgenden beiden Variablen eine signifikante Assoziation besteht:

  • rep78: Die Häufigkeit, mit der das Auto 1978 repariert wurde (zwischen 1 und 5).
  • foreign: ob der Fahrzeugtyp fremd ist oder nicht (0 = nein, 1 = ja)

Schritt 1: Laden Sie die Rohdaten und zeigen Sie sie an.

Zuerst laden wir die Daten, indem wir den folgenden Befehl eingeben:

sysuse auto

Wir können die Rohdaten anzeigen, indem wir den folgenden Befehl eingeben:

br

Rohdaten für Auto-Dataset in Stata

Jede Zeile zeigt Informationen für ein einzelnes Auto an, einschließlich Preis, mpg, Gewicht, Länge und einer Vielzahl anderer Variablen. Die einzigen zwei Variablen, die uns interessieren, sind rep78 und foreign.

Schritt 3: Führen Sie den Chi-Quadrat-Unabhängigkeitstest durch.

Wir werden die folgende Syntax verwenden, um den Test durchzuführen:

tab first_variable second_variable, chi2

Hier ist die genaue Syntax, die wir in unserem Fall verwenden werden:

tab rep78 foreign, chi2

Chi-Quadrat-Test der Unabhängigkeitsleistung in Stata

So interpretieren Sie die Ausgabe:

Übersichtstabelle: Diese Tabelle zeigt die Gesamtzahl für jede Kombination von rep78 und foreign. Beispielsweise

  • Es gab 2 Autos, die inländisch waren und 1978 1 Reparatur erhielten.
  • Es gab 8 Autos, die inländisch waren und 1978 2 Reparaturen erhielten.
  • Es gab 27 Autos, die inländisch waren und 1978 3 Reparaturen erhielten.

Und so weiter.

Pearson chisq(4): Dies ist die Chi-Quadrat-Teststatistik für den Test. Es stellt sich heraus, 27.2640 zu sein.

Pr: Dies ist der p-Wert, der mit der Chi-Quadrat-Teststatistik verknüpft ist. Es stellt sich heraus, 0.000 zu sein. Da dies weniger als 0,05 ist, können wir die Nullhypothese, dass die beiden Variablen unabhängig sind, nicht ablehnen. Wir haben genügend Beweise, um zu dem Schluss zu kommen, dass ein statistisch signifikanter Zusammenhang zwischen der Frage, ob ein Auto foreign war oder nicht, und der Gesamtzahl der erhaltenen Reparaturen besteht.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren:
Rechner

Phi-Koeffizient-Rechner

    Ein Phi-Koeffizient ist ein Maß für die Assoziation zwischen zwei binären Variablen.

    Um den Phi-Koeffizienten für eine 2 × 2-Tabelle mit zwei Zufallsvariablen zu berechnen, füllen Sie einfach die Zellen der …