Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Ein Breusch-Pagan-Test wird verwendet, um festzustellen, ob in einer Regressionsanalyse Heteroskedastizität vorliegt.
In diesem Tutorial wird erklärt, wie ein Breusch-Pagan-Test in Excel durchgeführt wird.
In diesem Beispiel verwenden wir den folgenden Datensatz, der die Attribute von 10 Basketballspielern beschreibt.
Wir werden ein multiples lineares Regressionsmodell anpassen, das die Bewertung als Antwortvariable und Punkte, Assists und Rebounds als erklärende Variablen verwendet. Dann werden wir einen Breusch-Pagan-Test durchführen, um festzustellen, ob Heteroskedastizität in der Regression vorhanden ist.
Schritt 1: Führen Sie eine multiple lineare Regression durch.
Wechseln Sie in Excel im oberen Menüband zur Registerkarte Daten und klicken Sie auf Datenanalyse. Wenn diese Option nicht angezeigt wird, müssen Sie zuerst das kostenlose Analysis ToolPak installieren.
Sobald Sie auf Datenanalyse klicken, wird ein neues Fenster geöffnet. Wählen Sie Regression und klicken Sie auf OK. Füllen Sie die erforderlichen Arrays für die Antwortvariablen und die erklärenden Variablen aus und klicken Sie auf OK.
Dies erzeugt die folgende Ausgabe:
Schritt 2: Berechnen Sie die quadratischen Residuen.
Als nächstes berechnen wir die vorhergesagten Werte und die quadratischen Residuen für jeden Antwortwert. Um die vorhergesagten Werte zu berechnen, verwenden wir die Koeffizienten aus der Regressionsausgabe:
Wir werden dieselbe Formel verwenden, um jeden vorhergesagten Wert zu erhalten:
Als nächstes berechnen wir die quadratischen Residuen für jede Vorhersage:
Wir werden die gleiche Formel verwenden, um jedes quadratische Residuum zu erhalten:
Schritt 3: Führen Sie eine neue multiple lineare Regression durch, wobei Sie die quadratischen Residuen als Antwortwerte verwenden.
Als Nächstes führen wir dieselben Schritte wie zuvor aus, um eine mehrfache lineare Regression unter Verwendung von Punkten, Assists und Rebounds als erklärende Variablen durchzuführen, außer dass wir diesmal die quadratischen Residuen als Antwortwerte verwenden. Hier ist die Ausgabe dieser Regression:
Schritt 4: Führen Sie den Breusch-Pagan-Test durch.
Zuletzt werden wir den Breusch-Pagan-Test durchführen, um festzustellen, ob in der ursprünglichen Regression Heteroskedastizität vorhanden war.
Zuerst berechnen wir die Chi-Quadrat-Teststatistik mit der Formel:
X 2 = n * R 2neu
wobei:
In unserem Beispiel ist X 2 = 10 * 0,600395 = 6,00395.
Als nächstes finden wir den p-Wert, der dieser Teststatistik zugeordnet ist. Wir können dazu die folgende Formel in Excel verwenden:
=CHIQU.VERT.RE(x, Freiheitsgrade)
In unserem Fall ist der Freiheitsgrad die Zahl, die für df der Regression in der Ausgabe angezeigt wird. In diesem Fall ist es 3. Somit lautet unsere Formel:
=CHIQU.VERT.RE(6.00395, 3) = 0.111418.
Da dieser p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Wir haben nicht genügend Beweise, um zu sagen, dass Heteroskedastizität im ursprünglichen Regressionsmodell vorhanden ist.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …