Ein Chi-Quadrat-Anpassungstest wird verwendet, um zu bestimmen, ob eine kategoriale Variable einer hypothetischen Verteilung folgt oder nicht.

In diesem Tutorial wird erklärt, wie ein Chi-Quadrat-Anpassungstest in Stata durchgeführt wird.

Beispiel: Chi-Quadrat-Anpassungstest in Stata

Um zu veranschaulichen, wie dieser Test durchgeführt wird, verwenden wir einen Datensatz namens nlsw88, der Informationen zur Arbeitsstatistik für Frauen in den USA von 1988 enthält.

Führen Sie die folgenden Schritte aus, um einen Chi-Quadrat-Anpassungstest durchzuführen, um festzustellen, ob die tatsächliche Verteilung der Rasse in diesem Datensatz wie folgt ist: 70% Weiß, 20% Schwarz, 10% Andere.

Schritt 1: Laden Sie die Rohdaten und zeigen Sie sie an.

Zuerst laden wir die Daten, indem wir den folgenden Befehl eingeben:

sysuse nlsw88

Wir können die Rohdaten anzeigen, indem wir den folgenden Befehl eingeben:

br

Rohdaten in Stata anzeigen

In jeder Zeile werden Informationen für eine Person angezeigt, einschließlich Alter, Rasse, Familienstand, Bildungsniveau und einer Vielzahl anderer Faktoren.

Schritt 2: Laden Sie das Fit-Paket.

Um einen Chi-Quadrat-Anpassungstest durchzuführen, müssen wir das csgof-Paket installieren. Wir können dies tun, indem wir den folgenden Befehl eingeben:

findit csgof

Ein neues Fenster wird geöffnet. Klicken Sie auf den Link csgof from https://stats.idre.ucla.edu/stat/stata/ado/analysis.

Ein weiteres Fenster wird geöffnet. Klicken Sie auf den Link, der besagt: click here to install.

Die Installation des Pakets sollte nur einige Sekunden dauern.

Schritt 3: Führen Sie den Anpassungstest durch.

Sobald das Paket installiert ist, können wir den Chi-Quadrat-Anpassungstest für die Daten durchführen, um festzustellen, ob die tatsächliche Verteilung des Rennens wie folgt ist: 70% Weiß, 20% Schwarz, 10% Andere.

Wir werden die folgende Syntax verwenden, um den Test durchzuführen:

csgof variable_of_interest, expperc(list_of_expected_percentages)

Hier ist die genaue Syntax, die wir in unserem Fall verwenden werden:

csgof race, expperc(70, 20, 10)

Chi-Quadrat-Anpassungsgüte in Stata

So interpretieren Sie die Ausgabe:

Zusammenfassungsbox: Dieses Feld zeigt uns den erwarteten Prozentsatz, die erwartete Häufigkeit und die beobachtete Häufigkeit für jedes Rennen. Beispielsweise:

  • Der erwartete Prozentsatz der Weißen betrug 70%. Dies ist der Prozentsatz, den wir angegeben haben.
  • Die erwartete Häufigkeit weißer Personen betrug 1.572,2. Dies wird unter Verwendung der Tatsache berechnet, dass der Datensatz 2.246 Personen enthielt, sodass 70% dieser Zahl 1.572,2 sind.
  • Die beobachtete Häufigkeit weißer Individuen betrug 1.637. Dies ist die tatsächliche Anzahl weißer Personen im Datensatz.

Chisq(2): Dies ist die Chi-Quadrat-Teststatistik für den Anpassungstest. Es stellt sich heraus, 218,13 zu sein.

p: Dies ist der p-Wert, der der Chi-Quadrat-Teststatistik zugeordnet ist. Es stellt sich heraus, dass es 0 ist. Da dies weniger als 0,05 ist, können wir die Nullhypothese, dass die wahre Verteilung der Rasse 70% Weiß, 20% Schwarz, 10% Andere ist, nicht ablehnen. Wir haben genügend Beweise, um zu dem Schluss zu kommen, dass sich die wahre Verteilung der Rasse von dieser hypothetischen Verteilung unterscheidet.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren:
Rechner

Phi-Koeffizient-Rechner

    Ein Phi-Koeffizient ist ein Maß für die Assoziation zwischen zwei binären Variablen.

    Um den Phi-Koeffizienten für eine 2 × 2-Tabelle mit zwei Zufallsvariablen zu berechnen, füllen Sie einfach die Zellen der …