Durchführen einer quadratischen Regression in Stata

Von Fabian
Kategorie: STATA
Tags: Regression
Lesezeit: 4 Minuten

Wenn zwei Variablen eine lineare Beziehung haben, können Sie häufig eine einfache lineare Regression verwenden, um ihre Beziehung zu quantifizieren.

Beispiel einer linearen Beziehung

Wenn jedoch zwei Variablen eine quadratische Beziehung haben, können Sie stattdessen die quadratische Regression verwenden, um ihre Beziehung zu quantifizieren.

Beispiel einer quadratischen Beziehung

In diesem Tutorial wird erklärt, wie Sie eine quadratische Regression in Stata durchführen.

Beispiel: Quadratische Regression in Stata

Angenommen, wir möchten die Beziehung zwischen der Anzahl der geleisteten Arbeitsstunden und dem Glück verstehen. Wir haben die folgenden Daten zur Anzahl der pro Woche geleisteten Arbeitsstunden und zum gemeldeten Glücksgrad (auf einer Skala von 0 bis 100) für 16 verschiedene Personen:

Quadratischer Regressionsdatensatz in StataSie können dieses Beispiel replizieren, indem Sie genau diese Daten über Daten> Dateneditor> Dateneditor (Bearbeiten) in der oberen Menüleiste in Stata eingeben.

Führen Sie die folgenden Schritte aus, um eine quadratische Regression in Stata durchzuführen.

Schritt 1: Visualisieren Sie die Daten.

Bevor wir die quadratische Regression verwenden können, müssen wir sicherstellen, dass die Beziehung zwischen der erklärenden Variablen (hours) und der Antwortvariablen (happiness) tatsächlich quadratisch ist. Lassen Sie uns die Daten mithilfe eines Streudiagramms visualisieren, indem Sie Folgendes in das Befehlsfeld eingeben:

scatter happiness hours

zerstreue Glücksstunden

Quadratisches Streudiagramm in Stata

Wir können sehen, dass das Glück tendenziell zunimmt, wenn die Anzahl der geleisteten Arbeitsstunden von Null bis zu einem bestimmten Punkt steigt, dann aber abnimmt, wenn die Anzahl der geleisteten Arbeitsstunden etwa 30 überschreitet.

Diese verkehrte „U“-Form im Streudiagramm zeigt an, dass es eine quadratische Beziehung zwischen geleisteten Arbeitsstunden und Glück gibt, was bedeutet, dass wir eine quadratische Regression verwenden sollten, um diese Beziehung zu quantifizieren.

Schritt 2: Führen Sie eine quadratische Regression durch.

Bevor wir das quadratische Regressionsmodell an die Daten anpassen, müssen wir eine neue Variable für die quadratischen Werte unserer Prädiktorvariablen Stunden erstellen. Wir können dies tun, indem wir Folgendes in das Befehlsfeld eingeben:

gen hours2 = hours*hours

Sie können diese neue Variable anzeigen, indem Sie im oberen Menü zu Daten> Dateneditor> Dateneditor (Durchsuchen) gehen.

Quadratische Regression in Stata

Wir können sehen, dass Stunden2 einfach Stunden im Quadrat sind. Jetzt können wir eine quadratische Regression durchführen, indem wir hours und hours2 als erklärende Variablen und happiness als Antwortvariable verwenden. Geben Sie Folgendes in das Befehlsfeld ein, um eine quadratische Regression durchzuführen:

regress happiness hours hours2

Quadratische Regressionsausgabe in Stata

So interpretieren Sie die interessantesten Zahlen in der Ausgabe:

Prob> F: 0,000. Dies ist der p-Wert für die Gesamtregression. Da dieser Wert kleiner als 0,05 ist, bedeutet dies, dass die Prädiktorvariablen hours und hours2 zusammen eine statistisch signifikante Beziehung zu der Antwortvariablen happiness haben.

R-Quadrat: 0,9092. Dies ist der Anteil der Varianz in der Antwortvariablen, der durch die erklärende Variable erklärt werden kann. In diesem Beispiel können 90,92% der Variation von happiness durch hours und hours2 erklärt werden.

Regressionsgleichung: Wir können eine Regressionsgleichung unter Verwendung der in der Ausgabetabelle angegebenen Koeffizientenwerte bilden. In diesem Fall wäre die Gleichung:

predicted happiness = -30.25287 + 7.173061(hours) – .1069887(hours2)

Wir können diese Gleichung verwenden, um das vorhergesagte Glück eines Individuums zu ermitteln, wenn man bedenkt, wie viele Stunden es pro Woche arbeitet.

Zum Beispiel wird vorausgesagt, dass eine Person, die 60 Stunden pro Woche arbeitet, ein Glücksniveau von 14,97 hat:

predicted happiness = -30.25287 + 7.173061(60) – .1069887(602) = 14.97.

Umgekehrt wird vorausgesagt, dass eine Person, die 30 Stunden pro Woche arbeitet, ein Glücksniveau von 88,65 hat:

predicted happiness = -30.25287 + 7.173061(30) – .1069887(302) = 88.65.

Schritt 3: Reporten Sie die Ergebnisse.

Zuletzt möchten wir die Ergebnisse unserer quadratischen Regression berichten. Hier ist ein Beispiel dafür:

Eine quadratische Regression wurde durchgeführt, um die Beziehung zwischen der Anzahl der von einer Person geleisteten Arbeitsstunden und ihrem entsprechenden Glücksgrad (gemessen von 0 bis 100) zu quantifizieren. Bei der Analyse wurde eine Probe von 16 Personen verwendet.

Die Ergebnisse zeigten, dass es eine statistisch signifikante Beziehung zwischen den erklärenden Variablen hours und hours2 und der Antwortvariablen happiness gab (F (2, 13) = 65,09, p <0,0001).

Zusammen machten diese beiden erklärenden Variablen 90,92% der erklärten Variabilität des Glücks aus.

Die Regressionsgleichung lautete wie folgt:

predicted happiness = -30.25287 + 7.173061(hours) – .1069887(hours2)

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: