Erstellen und Interpretieren von Q-Q-Plots in Stata

Von Fabian
Kategorie: STATA
Lesezeit: 2 Minuten

Ein Q-Q-Diagramm, kurz für „Quantil-Quantil“-Diagramm, wird häufig verwendet, um zu bewerten, ob die Residuen in einer Regressionsanalyse normal verteilt sind oder nicht.

In diesem Tutorial wird erklärt, wie Sie ein Q-Q-Diagramm in Stata erstellen und interpretieren.

Beispiel: Q-Q-Plot in Stata

In diesem Beispiel verwenden wir das in Stata integrierte auto Dataset. Wir werden ein multiples lineares Regressionsmodell anpassen, das mpg und displacement als erklärende Variablen und price als Antwortvariable verwendet. Wir werden dann die Residuen für das Modell erhalten und ein Q-Q-Diagramm erstellen, um zu sehen, ob die Residuen einer Normalverteilung folgen.

Schritt 1: Laden und Anzeigen der Daten.

Zuerst laden wir die Daten mit dem folgenden Befehl:

sysuse auto

Als nächstes erhalten wir eine kurze Zusammenfassung der Daten mit dem folgenden Befehl:

summarize

Befehl in Stata zusammenfassen

Schritt 2: Passen Sie das Regressionsmodell an.

Als Nächstes verwenden wir den folgenden Befehl, um das Regressionsmodell anzupassen:

regress price mpg displacement

Ausgabe des Regressionsmodells in Stata

Schritt 3: Berechnen Sie die Residuen.

Denken Sie daran, dass ein Residuum einfach die Differenz zwischen dem vorhergesagten Antwortwert (berechnet durch die geschätzte Regressionsgleichung) und dem tatsächlichen Antwortwert ist.

Wir können die Residuen jeder Vorhersage erhalten, indem wir den Befehl residuals verwenden und diese Werte in einer Variablen mit dem Namen speichern, wie wir möchten. In diesem Fall verwenden wir den Namen resid_price:

predict resid_price, residuals

Schritt 4: Erstellen Sie das Q-Q-Diagramm.

Nachdem wir eine Liste der Residuen haben, können wir mit dem Befehl qnorm ein Q-Q-Diagramm erstellen :

qnorm resid_price

Q-Q-Plot in Stata

Schritt 5: Interpretieren Sie das Q-Q-Diagramm.

Die Idee hinter einem Q-Q-Diagramm ist einfach: Wenn die Residuen in einem Winkel von 45 Grad entlang einer ungefähr geraden Linie fallen, sind die Residuen ungefähr normal verteilt. Wir können in unserem Q-Q-Diagramm oben sehen, dass die Residuen dazu neigen, ziemlich stark von der 45-Grad-Linie abzuweichen, insbesondere an den hinteren Enden, was ein Hinweis darauf sein könnte, dass sie nicht normal verteilt sind.

Obwohl ein Q-Q-Diagramm kein formaler statistischer Test ist, bietet es eine einfache Möglichkeit, visuell zu überprüfen, ob die Residuen normal verteilt sind oder nicht.

Wenn sich herausstellt, dass Ihre Residuen stark von der 45-Grad-Linie im Q-Q-Diagramm abweichen, können Sie eine Transformation für die Antwortvariable in Ihrer Regression in Betracht ziehen, z. B. die Quadratwurzel oder das Protokoll der Antwortvariablen.

Wenn die Residuen nur geringfügig abweichen, müssen Sie sich keine Gedanken über die Transformation der Antwortvariablen machen, da die Regression gegenüber Abweichungen von der Normalverteilung ziemlich robust ist.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: