Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Immer wenn wir ein lineares Regressionsmodell anpassen, nimmt das Modell die folgende Form an:
Y = β 0 + β 1 X + … + β i X +ϵ
wobei ϵ ein von X unabhängiger Fehler ist.
Unabhängig davon, wie gut X verwendet werden kann, um die Werte von Y vorherzusagen, wird es immer einen zufälligen Fehler im Modell geben.
Eine Möglichkeit, die Streuung dieses Zufallsfehlers zu messen, besteht darin, den Standardfehler der Regression zu verwenden, mit dem die Standardabweichung der Residuen ϵ gemessen wird.
Dieses Tutorial bietet ein schrittweises Beispiel für die Berechnung des Standardfehlers eines Regressionsmodells in Excel.
In diesem Beispiel erstellen wir ein Dataset, das die folgenden Variablen für 12 verschiedene Schüler enthält:
Als Nächstes passen wir ein multiples lineares Regressionsmodell an, wobei das Prüfungsergebnis als Antwortvariable und die Stunden mit dem Lernen verbracht und die Derzeitige Note als Prädiktorvariablen verwendet werden.
Klicken Sie dazu im oberen Menüband auf die Registerkarte Daten und dann auf Datenanalyse:
Wenn diese Option nicht verfügbar ist, müssen Sie zuerst das Data Analysis ToolPak laden.
Wählen Sie im angezeigten Fenster Regression aus. Geben Sie im neuen Fenster, das angezeigt wird, die folgenden Informationen ein:
(Die Analyse im untenstehenden Bild wurden mit einer englischsprachen Excel-Version erstellt. In der deutschen Version können die Begriffe abweichen.)
Sobald Sie auf OK klicken, wird die Ausgabe des Regressionsmodells angezeigt:
Der Standardfehler des Regressionsmodells ist die Zahl neben Standard Error:
Der Standardfehler dieses speziellen Regressionsmodells beträgt 2.790029.
Diese Zahl stellt den durchschnittlichen Abstand zwischen den tatsächlichen Prüfungsergebnissen und den vom Modell vorhergesagten Prüfungsergebnissen dar.
Beachten Sie, dass einige der Prüfungsergebnisse mehr als 2,79 Einheiten von der vorhergesagten Punktzahl entfernt sind, während andere näher liegen. Im Durchschnitt beträgt der Abstand zwischen den tatsächlichen Prüfungsergebnissen und den vorhergesagten Ergebnissen jedoch 2.790029.
Beachten Sie auch, dass ein kleinerer Standardfehler der Regression anzeigt, dass ein Regressionsmodell besser auf einem Datensatz angepasst ist.
Wenn wir also ein neues Regressionsmodell an den Datensatz anpassen und am Ende einen Standardfehler von beispielsweise 4,53 erhalten, würde dieses neue Modell Prüfungsergebnisse schlechter vorhersagen als das vorherige Modell.
Eine andere gängige Methode zum Messen der Genauigkeit eines Regressionsmodells ist die Verwendung von R-Quadrat. In diesem Artikel finden Sie eine schöne Erklärung der Vorteile der Verwendung des Standardfehlers der Regression zur Messung der Präzision im Vergleich zum R-Quadrat.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …