Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
R-Quadrat, oft geschrieben als R2, ist der Anteil der Varianz in der Antwortvariablen, der durch die Prädiktorvariablen in einem linearen Regressionsmodell erklärt werden kann.
Der Wert für R-Quadrat kann von 0 bis 1 reichen. Ein Wert von 0 zeigt an, dass die Antwortvariable überhaupt nicht durch die Prädiktorvariable erklärt werden kann, während ein Wert von 1 anzeigt, dass die Antwortvariable ohne Fehler durch den Prädiktor perfekt erklärt werden kann Variablen.
Das angepasste R-Quadrat (auch angepasstes Bestimmtheitsmap) ist eine modifizierte Version von R-Quadrat, die die Anzahl der Prädiktoren in einem Regressionsmodell anpasst. Es wird berechnet als:
Angepasstes R2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]
wo:
Da R2 immer ansteigt, wenn Sie einem Modell weitere Prädiktoren hinzufügen, kann das angepasste R2 als Metrik dienen, die Ihnen angibt, wie nützlich ein Modell ist, angepasst an die Anzahl der Prädiktoren in einem Modell.
Dieses Tutorial bietet ein schrittweises Beispiel für die Berechnung des angepassten R2 für ein Regressionsmodell in R.
In diesem Beispiel erstellen wir ein Dataset, das die folgenden Variablen für 12 verschiedene Schüler enthält:
Als Nächstes passen wir ein multiples lineares Regressionsmodell an, wobei das Prüfungsergebnis als Antwortvariable und die Studienstunden und die aktuelle Note als Prädiktorvariablen verwendet werden.
Um dieses Modell anzupassen, klicken Sie im oberen Menüband auf die Registerkarte Daten und dann auf Datenanalyse:
Wenn diese Option nicht verfügbar ist, müssen Sie zuerst das Data Analysis ToolPak laden.
Wählen Sie im angezeigten Fenster Regression aus. Geben Sie im neuen Fenster, das angezeigt wird, die folgenden Informationen ein:
Sobald Sie auf OK klicken, wird die Ausgabe des Regressionsmodells angezeigt:
Das bereinigte R-Quadrat des Regressionsmodells ist die Zahl neben dem bereinigten R-Quadrat:
Das angepasste R-Quadrat für dieses Modell ergibt 0,946019.
Dieser Wert ist sehr hoch, was darauf hindeutet, dass die Vorhersagevariablen Study Hours und Current Grade einen guten Job machn die Variable Exam Score vorherzusagen.
Was ist ein guter R-Quadrat-Wert?
So berechnen Sie das bereinigte R-Quadrat in R
So berechnen Sie das bereinigte R-Quadrat in Python
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …