So führen Sie einen Kruskal-Wallis-Test in Stata durch

Von Fabian
Kategorie: STATA
Tags: ANOVA
Lesezeit: 3 Minuten

Ein Kruskal-Wallis-Test wird verwendet, um festzustellen, ob es einen statistisch signifikanten Unterschied zwischen den Medianwerten von drei oder mehr unabhängigen Gruppen gibt oder nicht. Es wird als nicht parametrisches Äquivalent der einfaktoriellen ANOVA angesehen.

In diesem Tutorial wird erklärt, wie ein Kruskal-Wallis-Test in Stata durchgeführt wird.

So führen Sie einen Kruskal-Wallis-Test in Stata durch

In diesem Beispiel verwenden wir den Volkszählungsdatensatz, der Volkszählungsdaten von 1980 für alle fünfzig Bundesstaaten in den USA enthält. Innerhalb des Datensatzes werden die Bundesstaaten in vier verschiedene Regionen eingeteilt:

  • Nordost
  • North Central
  • Süd
  • Westen

Wir werden einen Kruskal-Wallis-Test durchführen, um festzustellen, ob das Durchschnittsalter in diesen vier Regionen gleich ist.

Schritt 1: Laden und Anzeigen der Daten.

Laden Sie zunächst den Datensatz, indem Sie den folgenden Befehl in das Befehlsfeld eingeben:

use http://www.stata-press.com/data/r13/census

Mit dem folgenden Befehl erhalten Sie eine kurze Zusammenfassung des Datensatzes:

summarize

Zusammenfassen eines Datensatzes in Stata

Wir können sehen, dass dieser Datensatz 13 verschiedene Variablen enthält, aber die einzigen zwei, mit denen wir arbeiten werden, sind medage (Durchschnittsalter) und region.

Schritt 2: Visualisieren Sie die Daten.

Bevor wir den Kruskal-Wallis-Test durchführen, erstellen wir zunächst einige Box-Plots, um die Verteilung des Durchschnittsalters für jede der vier Regionen zu visualisieren:

graph box medage, over(region)

Mehrere Boxplots in einem Plot in Stata

Wenn wir uns nur die Box-Plots ansehen, können wir sehen, dass die Verteilungen zwischen den Regionen zu variieren scheinen. Als nächstes führen wir einen Kruskal-Wallis-Test durch, um festzustellen, ob diese Unterschiede statistisch signifikant sind.

Schritt 3: Führen Sie einen Kruskal-Wallis-Test durch.

Verwenden Sie die folgende Syntax, um einen Kruskal-Wallis-Test durchzuführen:

kwallis measurement_variable, by(grouping_variable)

In unserem Fall verwenden wir die folgende Syntax:

kwallis medage, by(region)

Kruskal-Wallis-Ausgabe in Stata

So interpretieren Sie die Ausgabe:

Übersichtstabelle: Diese Tabelle zeigt die Anzahl der Beobachtungen pro Region und die Rangsummen für jede Region.

Chi-Quadrat with ties: Dies ist der Wert der Teststatistik, der sich als 17.062 herausstellt.

probability: Dies ist der p-Wert, der der Teststatistik entspricht, die sich als 0,0007 herausstellt. Da dieser Wert kleiner als 0,05 ist, können wir die Nullhypothese ablehnen und daraus schließen, dass das Durchschnittsalter in allen vier Regionen nicht gleich ist.

Schritt 4: Ergebnisse.

Zuletzt möchten wir die Ergebnisse des Kruskal-Wallis-Tests berichten. Hier ist ein Beispiel dafür:

Ein Kruskal-Wallist-Test wurde durchgeführt, um festzustellen, ob das Durchschnittsalter der Personen in den folgenden vier Regionen in den USA gleich war:

  • Nordosten (n = 9)
  • North Central (n = 12)
  • Süd (n = 16)
  • West (n = 13)

Der Test ergab, dass das Durchschnittsalter der Personen in allen vier Regionen nicht gleich war (X 2 = 17,062, p = 0,0007). Das heißt, es gab einen statistisch signifikanten Unterschied im Durchschnittsalter zwischen zwei oder mehr Regionen.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: