Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
In der Statistik ist die einfache lineare Regression eine Technik, mit der wir die Beziehung zwischen einer Prädiktorvariablen x und einer Antwortvariablen y quantifizieren können.
Wenn wir eine einfache lineare Regression durchführen, erhalten wir eine „Linie der besten Anpassung“, die die Beziehung zwischen x und y beschreibt. Diese kann wie folgt geschrieben werden:
ŷ = b 0 + b 1 x
wo:
Manchmal sind wir daran interessiert, diese Linie der besten Anpassung zu verwenden, um ein Vorhersageintervall für einen gegebenen Wert von x 0 zu konstruieren, das ein Intervall um den vorhergesagten Wert ŷ 0 ist, so dass eine Wahrscheinlichkeit von 95% besteht, dass der reale Wert von y in Die Population, die x 0 entspricht, liegt innerhalb dieses Intervalls.
Die Formel zur Berechnung des Vorhersageintervalls für einen bestimmten Wert x 0 lautet wie folgt:
ŷ 0 +/- t α / 2, df = n-2 * se
wo:
Die Formel mag ein wenig einschüchternd aussehen, aber die Berechnung in Excel ist eigentlich unkompliziert. Als Nächstes werden wir ein Beispiel für die Verwendung dieser Formel zur Berechnung eines Vorhersageintervalls für einen bestimmten Wert in Excel durchgehen.
Der folgende Datensatz zeigt die Anzahl der Stunden, die zusammen mit der Prüfungsnote von 15 verschiedenen Studenten studiert wurden:
Angenommen, wir möchten ein Vorhersageintervall von 95% für den Wert x 0 = 3 erstellen. Das heißt, wir möchten ein Intervall erstellen, bei dem eine Wahrscheinlichkeit von 95% besteht, dass die Prüfungsergebnisse für einen Studenten, für den studiert wird, innerhalb dieses Intervalls liegen 3 Stunden.
Der folgende Screenshot zeigt, wie alle erforderlichen Werte berechnet werden, um dieses Vorhersageintervall zu erhalten.
Hinweis: Die Formeln in Spalte F zeigen, wie die Werte in Spalte E berechnet wurden.
(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)
Das 95%-Vorhersageintervall für einen Wert von x 0 = 3 beträgt (74,64, 86,90). Das heißt, wir sagen mit einer Wahrscheinlichkeit von 95% voraus, dass ein Student, der 3 Stunden studiert, eine Punktzahl zwischen 74,64 und 86,90 erreicht.
Ein paar Anmerkungen zu den verwendeten Berechnungen:
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …