Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Wir verwenden oft drei verschiedene Quadratsummenwerte, um zu messen, wie gut eine Regressionslinie tatsächlich zu einem Datensatz passt:
1. Totale Quadratsumme (SST) – Die Summe der quadrierten Differenzen zwischen einzelnen Datenpunkten (y i ) und dem Mittelwert der Antwortvariablen ( y ).
2. Residuenquadratsumme (SSR) – Die Summe der quadrierten Differenzen zwischen vorhergesagten Datenpunkten (ŷ i ) und dem Mittelwert der Antwortvariablen ( y ).
3. Quadratsummenfehler (SSE) – Die Summe der quadrierten Differenzen zwischen vorhergesagten Datenpunkten (ŷ i ) und beobachteten Datenpunkten (y i ).
Das folgende Schritt-für-Schritt-Beispiel zeigt, wie jede dieser Metriken für ein bestimmtes Regressionsmodell in Excel berechnet wird.
Lassen Sie uns zunächst einen Datensatz erstellen, der die Anzahl der studierten Stunden und das Prüfungsergebnis von 20 verschiedenen Schülern an einer bestimmten Schule enthält:
Klicken Sie im oberen Menüband in Excel auf die Registerkarte Daten und dann auf Datenanalyse. Wenn diese Option nicht angezeigt wird, müssen Sie zuerst das kostenlose Analysis ToolPak installieren.
Sobald Sie auf Datenanalyse klicken, öffnet sich ein neues Fenster. Wählen Sie Regression und klicken Sie auf OK.
Geben Sie im neuen Fenster, das angezeigt wird, die folgenden Informationen ein:
Sobald Sie auf OK klicken, wird die Regressionsausgabe angezeigt.
Die drei Quadratsummenmetriken – SST, SSR und SSE – sind in der SS-Spalte der ANOVA-Tabelle zu sehen:
Als Metriken stellen sich heraus:
Wir können überprüfen, dass SST = SSR + SSE:
Wir können das R-Quadrat des Regressionsmodells auch manuell berechnen:
Dies sagt uns, dass 73,48 % der Unterschiede in den Prüfungsergebnissen durch die Anzahl der studierten Stunden erklärt werden können.
So führen Sie eine einfache lineare Regression in Excel durch
So führen Sie mehrere lineare Regressionen in Excel durch
So führen Sie eine polynomielle Regression in Excel durch
So führen Sie eine exponentielle Regression in Excel durch
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …