So führen Sie eine hierarchische Regression in Stata durch

Von Fabian
Kategorie: STATA
Tags: Regression
Lesezeit: 4 Minuten

Hierarchische Regression ist eine Technik, mit der wir verschiedene lineare Modelle vergleichen können.

Die Grundidee ist, dass wir zuerst ein lineares Regressionsmodell mit nur einer erklärenden Variablen anpassen. Dann passen wir ein anderes Regressionsmodell unter Verwendung einer zusätzlichen erklärenden Variablen an. Wenn das R-Quadrat (der Anteil der Varianz in der Antwortvariablen, der durch die erklärenden Variablen erklärt werden kann) im zweiten Modell signifikant höher ist als das R-Quadrat im vorherigen Modell, bedeutet dies, dass das zweite Modell besser ist.

Anschließend wiederholen wir den Vorgang des Anpassen zusätzlicher Regressionsmodelle mit erklärenderen Variablen und prüfen, ob die neueren Modelle eine Verbesserung gegenüber den vorherigen Modellen bieten.

Dieses Tutorial enthält ein Beispiel für die Durchführung einer hierarchischen Regression in Stata.

Beispiel: Hierarchische Regression in Stata

Wir werden ein integriertes Dataset namens auto verwenden, um zu veranschaulichen, wie eine hierarchische Regression in Stata durchgeführt wird. Laden Sie zunächst den Datensatz, indem Sie Folgendes in das Befehlsfeld eingeben:

sysuse auto

Mit dem folgenden Befehl können wir eine schnelle Zusammenfassung der Daten erhalten:

summarize

Zusammenfassung des automatischen Datensatzes in Stata

Wir können sehen, dass der Datensatz Informationen zu 12 verschiedenen Variablen für insgesamt 74 Autos enthält.

Wir werden die folgenden drei linearen Regressionsmodelle anpassen und die hierarchische Regression verwenden, um festzustellen, ob jedes nachfolgende Modell eine signifikante Verbesserung gegenüber dem vorherigen Modell bietet oder nicht:

Modell 1: price = intercept + mpg

Modell 2: price = intercept + mpg + weight

Modell 3: price = intercept + mpg + weight + gear ratio

Um eine hierarchische Regression in Stata durchzuführen, müssen wir zuerst das hireg-Paket installieren. Geben Sie dazu Folgendes in das Befehlsfeld ein:

findit hireg

Klicken Sie im angezeigten Fenster auf hireg from http://fmwww.bc.edu/RePEc/bocode/h

Installieren Sie das Hireg-Paket in Stata

Klicken Sie im nächsten Fenster auf den Link „click here to install“.

Paket hireg Stata

Das Paket wird in wenigen Sekunden installiert. Als nächstes verwenden wir den folgenden Befehl, um eine hierarchische Regression durchzuführen:

hireg price (mpg) (weight) (gear_ratio)

Dies fordert Stata auf, Folgendes zu tun:

  • Führen Sie eine hierarchische Regression mit dem price als Antwortvariable in jedem Modell durch.
  • Verwenden Sie für das erste Modell mpg als erklärende Variable.
  • Fügen Sie für das zweite Modell das weight als zusätzliche erklärende Variable hinzu.
  • Fügen Sie für das dritte Modell gear_ratio als weitere erklärende Variable hinzu.

Hier ist die Ausgabe des ersten Modells:

Hierarchische Regressionsausgabe in Stata

Wir sehen, dass das R-Quadrat des Modells 0,2196 beträgt und der Gesamt-p-Wert (Prob> F) für das Modell 0,0000 beträgt, was bei α = 0,05 statistisch signifikant ist.

Als nächstes sehen wir die Ausgabe des zweiten Modells:

Hierarchische Regressionsausgabe des zweiten Modells in Stata

Das R-Quadrat dieses Modells beträgt 0,2934 und ist damit größer als das erste Modell. Um festzustellen, ob dieser Unterschied statistisch signifikant ist, führte Stata einen F-Test durch, der die folgenden Zahlen am unteren Rand der Ausgabe ergab:

  • R-Quadrat-Differenz zwischen den beiden Modellen = 0,074
  • F-Statistik für die Differenz = 7,416
  • Entsprechender p-Wert der F-Statistik = 0,008

Da der p-Wert weniger als 0,05 beträgt, schließen wir, dass das zweite Modell im Vergleich zum ersten Modell statistisch signifikant verbessert ist.

Zuletzt können wir die Ausgabe des dritten Modells sehen:

Hierarchische Regression in der Stata-Interpretation

Das R-Quadrat dieses Modells beträgt 0,3150, was größer als das zweite Modell ist. Um festzustellen, ob dieser Unterschied statistisch signifikant ist, führte Stata einen F-Test durch, der die folgenden Zahlen am unteren Rand der Ausgabe ergab:

  • R-Quadrat-Differenz zwischen den beiden Modellen = 0,022
  • F-Statistik für die Differenz = 2,206
  • Entsprechender p-Wert der F-Statistik = 0,142

Da der p-Wert nicht weniger als 0,05 beträgt, gibt es keine ausreichenden Beweise dafür, dass das dritte Modell eine Verbesserung gegenüber dem zweiten Modell bietet.

Ganz am Ende der Ausgabe sehen wir, dass Stata eine Zusammenfassung der Ergebnisse liefert:

Hierarchische Regression führt zu Stata

In diesem speziellen Beispiel würden wir den Schluss ziehen, dass Modell 2 eine signifikante Verbesserung gegenüber Modell 1 bietet, Modell 3 jedoch keine signifikante Verbesserung gegenüber Modell 2.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: