Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Ein Q-Q-Diagramm, kurz für „Quantil-Quantil“-Diagramm, wird häufig verwendet, um zu bewerten, ob die Residuen in einer Regressionsanalyse normal verteilt sind oder nicht.
In diesem Tutorial wird erklärt, wie Sie ein Q-Q-Diagramm in Stata erstellen und interpretieren.
In diesem Beispiel verwenden wir das in Stata integrierte auto Dataset. Wir werden ein multiples lineares Regressionsmodell anpassen, das mpg und displacement als erklärende Variablen und price als Antwortvariable verwendet. Wir werden dann die Residuen für das Modell erhalten und ein Q-Q-Diagramm erstellen, um zu sehen, ob die Residuen einer Normalverteilung folgen.
Schritt 1: Laden und Anzeigen der Daten.
Zuerst laden wir die Daten mit dem folgenden Befehl:
sysuse auto
Als nächstes erhalten wir eine kurze Zusammenfassung der Daten mit dem folgenden Befehl:
summarize
Schritt 2: Passen Sie das Regressionsmodell an.
Als Nächstes verwenden wir den folgenden Befehl, um das Regressionsmodell anzupassen:
regress price mpg displacement
Schritt 3: Berechnen Sie die Residuen.
Denken Sie daran, dass ein Residuum einfach die Differenz zwischen dem vorhergesagten Antwortwert (berechnet durch die geschätzte Regressionsgleichung) und dem tatsächlichen Antwortwert ist.
Wir können die Residuen jeder Vorhersage erhalten, indem wir den Befehl residuals verwenden und diese Werte in einer Variablen mit dem Namen speichern, wie wir möchten. In diesem Fall verwenden wir den Namen resid_price:
predict resid_price, residuals
Schritt 4: Erstellen Sie das Q-Q-Diagramm.
Nachdem wir eine Liste der Residuen haben, können wir mit dem Befehl qnorm ein Q-Q-Diagramm erstellen :
qnorm resid_price
Schritt 5: Interpretieren Sie das Q-Q-Diagramm.
Die Idee hinter einem Q-Q-Diagramm ist einfach: Wenn die Residuen in einem Winkel von 45 Grad entlang einer ungefähr geraden Linie fallen, sind die Residuen ungefähr normal verteilt. Wir können in unserem Q-Q-Diagramm oben sehen, dass die Residuen dazu neigen, ziemlich stark von der 45-Grad-Linie abzuweichen, insbesondere an den hinteren Enden, was ein Hinweis darauf sein könnte, dass sie nicht normal verteilt sind.
Obwohl ein Q-Q-Diagramm kein formaler statistischer Test ist, bietet es eine einfache Möglichkeit, visuell zu überprüfen, ob die Residuen normal verteilt sind oder nicht.
Wenn sich herausstellt, dass Ihre Residuen stark von der 45-Grad-Linie im Q-Q-Diagramm abweichen, können Sie eine Transformation für die Antwortvariable in Ihrer Regression in Betracht ziehen, z. B. die Quadratwurzel oder das Protokoll der Antwortvariablen.
Wenn die Residuen nur geringfügig abweichen, müssen Sie sich keine Gedanken über die Transformation der Antwortvariablen machen, da die Regression gegenüber Abweichungen von der Normalverteilung ziemlich robust ist.
Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Bei der Verwendung von Klassifizierungsmodellen beim maschinellen Lernen verwenden wir häufig zwei Metriken, um die Qualität des Modells zu bewerten, nämlich Präzision und Erinnerung.
Precision: Korrigieren Sie positive Vorhersagen im …