So führen Sie eine einfache lineare Regression in Stata durch

Von Fabian
Kategorie: STATA
Tags: Regression
Lesezeit: 4 Minuten

Die einfache lineare Regression ist eine Methode, mit der Sie die Beziehung zwischen einer erklärenden Variablen x und einer Antwortvariablen y verstehen können.

In diesem Tutorial wird erklärt, wie eine einfache lineare Regression in Stata durchgeführt wird.

Beispiel: Einfache lineare Regression in Stata

Angenommen, wir möchten die Beziehung zwischen dem Gewicht eines Autos und seinen Meilen pro Gallone verstehen. Um diese Beziehung zu untersuchen, können wir eine einfache lineare Regression durchführen, wobei das Gewicht als erklärende Variable und die Meilen pro Gallone als Antwortvariable verwendet werden.

Führen Sie die folgenden Schritte in Stata aus, um eine einfache lineare Regression mit dem Datensatz car durchzuführen, der Daten zu 74 verschiedenen Fahrzeugen enthält.

Schritt 1: Laden Sie die Daten.

Laden Sie die Daten, indem Sie Folgendes in das Befehlsfeld eingeben:

use Sie http://www.stata-press.com/data/r13/car

Schritt 2: Holen Sie sich eine Zusammenfassung der Daten.

Machen Sie sich ein schnelles Bild von den Daten, mit denen Sie arbeiten, indem Sie Folgendes in das Befehlsfeld eingeben:

summarize

Zusammenfassen von Daten in Stata

Wir können sehen, dass der Datensatz 12 verschiedene Variablen enthält, aber die einzigen zwei, die uns interessieren, sind mpg und weight.

Schritt 3: Visualisieren Sie die Daten.

Bevor wir eine einfache lineare Regression durchführen, erstellen wir zunächst ein Streudiagramm von weight gegen mpg, damit wir die Beziehung zwischen diesen beiden Variablen visualisieren und nach offensichtlichen Ausreißern suchen können. Geben Sie Folgendes in das Befehlsfeld ein, um ein Streudiagramm zu erstellen:

scatter mpg weight

Dies erzeugt das folgende Streudiagramm:

Streudiagramm in Stata

Wir können sehen, dass Autos mit höherem Gewicht tendenziell niedrigere Meilen pro Gallone haben. Um diese Beziehung zu quantifizieren, führen wir nun eine einfache lineare Regression durch.

Schritt 4: Führen Sie eine einfache lineare Regression durch.

Geben Sie Folgendes in das Befehlsfeld ein, um eine einfache lineare Regression mit weight als erklärende Variable und mpg als Antwortvariable durchzuführen.

regress mpg weight

Interpretieren von Regressionsausgaben in Stata

So interpretieren Sie die interessantesten Zahlen in der Ausgabe:

R-Quadrat: 0,6515. Dies ist der Anteil der Varianz in der Antwortvariablen, der durch die erklärende Variable erklärt werden kann. In diesem Beispiel können 65,15% der Variation in mpg durch das Gewicht erklärt werden.

Coef (weight): -0,006. Dies gibt Auskunft über die durchschnittliche Änderung der Antwortvariablen, die mit einer Erhöhung der erklärenden Variablen um eine Einheit verbunden ist. In diesem Beispiel ist jede Gewichtszunahme von einem Pfund mit einer Abnahme der mpg um durchschnittlich 0,006 verbunden.

Coef (_cons): 39,44028. Dies gibt uns den Durchschnittswert der Antwortvariablen an, wenn die erklärende Variable Null ist. In diesem Beispiel beträgt die durchschnittliche mpg 39,44028, wenn das Gewicht eines Autos Null ist. Die Interpretation ist nicht sehr sinnvoll, da das Gewicht eines Autos nicht Null sein kann, aber die Zahl 39.44028 wird benötigt, um eine Regressionsgleichung zu bilden.

P>|t| (weight): 0,000. Dies ist der p-Wert, der der Teststatistik für das Gewicht zugeordnet ist. In diesem Fall können wir, da dieser Wert weniger als 0,05 beträgt, schließen, dass eine statistisch signifikante Beziehung zwischen Gewicht und mpg besteht.

Regressionsgleichung: Zuletzt können wir eine Regressionsgleichung unter Verwendung der beiden Koeffizientenwerte bilden. In diesem Fall wäre die Gleichung:

vorhergesagter mpg = 39,44028 – 0,0060087 * (weight)

Wir können diese Gleichung verwenden, um die vorhergesagte mpg für ein Auto angesichts seines Gewichts zu finden. Zum Beispiel wird vorausgesagt, dass ein Auto mit einem Gewicht von 4.000 Pfund einen mpg von 15.405 hat:

vorhergesagter mpg = 39,44028 – 0,0060087 * (4000) = 15,405

Schritt 5: Ergebnisse.

Zuletzt möchten wir die Ergebnisse unserer einfachen linearen Regression berichten. Hier ist ein Beispiel dafür:

Eine lineare Regression wurde durchgeführt, um die Beziehung zwischen dem Gewicht eines Autos und seinen Meilen pro Gallone zu quantifizieren. Bei der Analyse wurde eine Stichprobe von 74 Autos verwendet.

Die Ergebnisse zeigten, dass es eine statistisch signifikante Beziehung zwischen weight und mpg gab (t = -11,60, p <0,0001) und dass das Gewicht 65,15% der erklärten Variabilität in mpg ausmachte.

Die Regressionsgleichung lautete wie folgt:

vorhergesagter mpg = 39,44 – 0,006 (weight)

Jedes zusätzliche Pfund war mit einer Abnahme von durchschnittlich 0,006 Meilen pro Gallone verbunden.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: