Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
R-Quadrat, oft als r2 geschrieben, ist ein Maß dafür, wie gut ein lineares Regressionsmodell zu einem Datensatz passt.
Technisch gesehen ist es der Anteil der Varianz in der Antwortvariablen, der durch die Prädiktorvariable erklärt werden kann.
Der Wert für r2 kann von 0 bis 1 reichen:
Verwandt: Was ist ein guter R-Quadrat-Wert?
In diesem Tutorial wird erklärt, wie Sie r2 für zwei Variablen in Excel berechnen.
Angenommen, wir haben die folgenden Daten für die Anzahl der studierten Stunden und das Prüfungsergebnis von 20 Schülern:
Angenommen, wir möchten ein einfaches lineares Regressionsmodell an diese Daten anpassen, wobei „Stunden“ als Prädiktorvariable und „Score“ als Antwortvariable verwendet werden.
Um das r2 für diese Daten zu finden, können wir die BESTIMMTHEITSMASS()-Funktion in Excel verwenden, die die folgende Syntax verwendet:
\=BESTIMMTHEITSMASS(bekannt_ys, bekannt_xs)
wo:
So sieht diese Formel in unserem Beispiel aus:
(Die Formeln im untenstehenden Bild wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)
In diesem Beispiel können 72,73 % der Abweichung in den Prüfungsergebnissen durch die Anzahl der studierten Stunden ("hours studied") erklärt werden.
Beachten Sie, dass die Ausgabe wie folgt aussehen würde ,wenn wir ein einfaches lineares Regressionsmodell an diese Daten anpassen:
Beachten Sie, dass der R-Quadrat-Wert in der ersten Tabelle 0,7273 ist, was dem Ergebnis entspricht, das wir mit der Funktion BESTIMMTHEITSMASS() erhalten haben.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …