Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Die logistische Regression ist eine Methode, mit der wir ein Regressionsmodell anpassen, wenn die Antwortvariable binär ist.
In diesem Tutorial wird erläutert, wie Sie eine logistische Regression in Excel durchführen.
Führen Sie die folgenden Schritte aus, um eine logistische Regression in Excel für ein Dataset durchzuführen, das zeigt, ob College-Basketballspieler in die NBA eingezogen wurden (Draft: 0 = Nein, 1 = Ja), basierend auf ihren Durchschnittspunkten, Rebounds und Assists in der vorherigen Jahreszeit.
Schritt 1: Geben Sie die Daten ein.
Geben Sie zunächst die folgenden Daten ein:
Schritt 2: Geben Sie Zellen für Regressionskoeffizienten ein.
Da das Modell drei erklärende Variablen enthält (pts, rebs, ast), erstellen wir Zellen für drei Regressionskoeffizienten plus eine für den Achsenabschnitt im Modell. Wir werden die Werte für jeden dieser Werte auf 0,001 setzen, aber wir werden sie später optimieren.
Als nächstes müssen wir einige neue Spalten erstellen, die wir zur Optimierung für diese Regressionskoeffizienten verwenden, einschließlich Logit, elogit , Wahrscheinlichkeit und Log-Likelihood.
Schritt 3: Erstellen Sie Werte für das Logit.
Als Nächstes erstellen wir die Protokollspalte mithilfe der folgenden Formel:
Schritt 4: Erstellen Sie Werte für elogit.
Als Nächstes erstellen wir Werte für elogit mithilfe der folgenden Formel:
Schritt 5: Erstellen Sie Werte für die Wahrscheinlichkeit.
Als nächstes erstellen wir Werte für die Wahrscheinlichkeit unter Verwendung der folgenden Formel:
Schritt 6: Erstellen Sie Werte für die Protokollwahrscheinlichkeit.
Als Nächstes erstellen wir Werte für die Protokollwahrscheinlichkeit mithilfe der folgenden Formel:
Schritt 7: Ermitteln Sie die Summe der Protokollwahrscheinlichkeiten.
Zuletzt finden wir die Summe der Log-Likehood Spalte. Dies ist die Zahl, die wir zu maximieren versuchen, um die Regressionskoeffizienten zu ermitteln.
Schritt 8: Verwenden Sie den Solver, um nach den Regressionskoeffizienten zu suchen.
Wenn Sie den Solver noch nicht in Excel installiert haben, führen Sie dazu die folgenden Schritte aus:
Wechseln Sie nach der Installation des Solvers zur Gruppe Analyse auf der Registerkarte Daten und klicken Sie auf Solver. Geben Sie die folgenden Informationen ein:
Klicken Sie dann auf Lösen.
Der Solver berechnet automatisch die Schätzungen des Regressionskoeffizienten:
Standardmäßig können die Regressionskoeffizienten verwendet werden, um die Wahrscheinlichkeit zu ermitteln, dass der Draft = 0 ist. In der Regel interessiert uns jedoch bei der logistischen Regression die Wahrscheinlichkeit, dass die Antwortvariable = 1 ist. Daher können wir einfach die Vorzeichen auf jedem der Zeichen umkehren Regressionskoeffizienten:
Diese Regressionskoeffizienten können nun verwendet werden, um die Wahrscheinlichkeit zu ermitteln, dass Draft = 1 ist.
Angenommen, ein Spieler erzielt durchschnittlich 14 Punkte pro Spiel, 4 Rebounds pro Spiel und 5 Assists pro Spiel. Die Wahrscheinlichkeit, dass dieser Spieler in die NBA eingezogen wird, kann wie folgt berechnet werden:
P(Draft = 1) = e 3,681193 + 0,112827 * (14) -0,39568 * (4) – 0,67954 * (5) / (1 + e 3,681193 + 0,112827 * (14) -0,39568 * (4) – 0,67954 * (5) ) ) = 0,57.
Da diese Wahrscheinlichkeit größer als 0,5 ist, sagen wir voraus, dass dieser Spieler in die NBA eingezogen werden würde.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …