Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Die multiple lineare Regression ist eine Methode, mit der wir die Beziehung zwischen mehreren erklärenden Variablen und einer Antwortvariablen verstehen können.
Leider ist ein Problem, das bei der Regression häufig auftritt, die Heteroskedastizität, bei der sich die Varianz der Residuen über einen Bereich von Messwerten systematisch ändert.
Ein Test, mit dem wir feststellen können, ob Heteroskedastizität vorliegt, ist der Breusch-Pagan-Test. Dieser Test erzeugt eine Chi-Quadrat-Teststatistik und einen entsprechenden p-Wert. Wenn der p-Wert unter einem bestimmten Schwellenwert liegt (übliche Auswahlmöglichkeiten sind 0,01, 0,05 und 0,10), gibt es ausreichende Hinweise darauf, dass Heteroskedastizität vorliegt.
In diesem Tutorial wird erklärt, wie ein Breusch-Pagan-Test in Stata durchgeführt wird.
Wir werden das integrierte automatische Stata-Dataset verwenden, um zu veranschaulichen, wie der Breusch-Pagan-Test durchgeführt wird.
Schritt 1: Laden und Anzeigen der Daten.
Verwenden Sie zunächst den folgenden Befehl, um die Daten zu laden:
sysuse auto
Zeigen Sie dann die Rohdaten mit dem folgenden Befehl an:
br
Schritt 2: Führen Sie eine multiple lineare Regression durch.
Als nächstes geben wir den folgenden Befehl ein, um eine multiple lineare Regression durchzuführen, wobei der Preis als Antwortvariable und mpg und das Gewicht als erklärende Variablen verwendet werden:
regress price mpg weight
Schritt 3: Führen Sie den Breusch-Pagan-Test durch.
Sobald wir das Regressionsmodell angepasst haben, können wir den Breusch-Pagan-Test mit dem hettest-Befehl durchführen, der für „Heteroskedastizitätstest“ steht:
hettest
So interpretieren Sie die Ausgabe:
Ho: Dies ist die Nullhypothese des Tests, die besagt, dass zwischen den Residuen eine konstante Varianz besteht.
Variablen: Hier erfahren Sie, welche Antwortvariable im Regressionsmodell verwendet wurde. In diesem Fall war es der variable Preis.
chi2 (1): Dies ist die Chi-Quadrat-Teststatistik des Tests. In diesem Fall ist es 14,78.
Prob> chi2: Dies ist der p-Wert, der der Chi-Quadrat-Teststatistik entspricht. In diesem Fall ist es 0,0001. Da dieser Wert kleiner als 0,05 ist, können wir die Nullhypothese ablehnen und daraus schließen, dass die Daten heteroskedastisch sind.
Wenn Sie die Nullhypothese des Breusch-Pagan-Tests nicht ablehnen, liegt keine Heteroskedastizität vor, und Sie können mit der Interpretation der Ausgabe der ursprünglichen Regression fortfahren.
Wenn Sie jedoch die Nullhypothese des Breusch-Pagan-Tests ablehnen, bedeutet dies, dass die Daten heteroskedastisch sind. In diesem Fall sind die Standardfehler, die in der Ausgabetabelle der Regression angezeigt werden, unzuverlässig. Es gibt verschiedene Möglichkeiten, um dieses Problem zu beheben, darunter:
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …