Durchführen einer logistischen Regression in Excel

Von Fabian
Kategorie: Excel
Tags: Regression
Lesezeit: 3 Minuten

Die logistische Regression ist eine Methode, mit der wir ein Regressionsmodell anpassen, wenn die Antwortvariable binär ist.

In diesem Tutorial wird erläutert, wie Sie eine logistische Regression in Excel durchführen.

Beispiel: Logistische Regression in Excel

Führen Sie die folgenden Schritte aus, um eine logistische Regression in Excel für ein Dataset durchzuführen, das zeigt, ob College-Basketballspieler in die NBA eingezogen wurden (Draft: 0 = Nein, 1 = Ja), basierend auf ihren Durchschnittspunkten, Rebounds und Assists in der vorherigen Jahreszeit.

Schritt 1: Geben Sie die Daten ein.

Geben Sie zunächst die folgenden Daten ein:

Rohdaten in Excel

Schritt 2: Geben Sie Zellen für Regressionskoeffizienten ein.

Da das Modell drei erklärende Variablen enthält (pts, rebs, ast), erstellen wir Zellen für drei Regressionskoeffizienten plus eine für den Achsenabschnitt im Modell. Wir werden die Werte für jeden dieser Werte auf 0,001 setzen, aber wir werden sie später optimieren.

Logistische Regression in Excel

Als nächstes müssen wir einige neue Spalten erstellen, die wir zur Optimierung für diese Regressionskoeffizienten verwenden, einschließlich Logit, elogit , Wahrscheinlichkeit und Log-Likelihood.

Schritt 3: Erstellen Sie Werte für das Logit.

Als Nächstes erstellen wir die Protokollspalte mithilfe der folgenden Formel:

Logistische Regressionsgleichung in Excel

Schritt 4: Erstellen Sie Werte für elogit.

Als Nächstes erstellen wir Werte für elogit mithilfe der folgenden Formel:

Logistische Regressionsberechnungen in Excel

Schritt 5: Erstellen Sie Werte für die Wahrscheinlichkeit.

Als nächstes erstellen wir Werte für die Wahrscheinlichkeit unter Verwendung der folgenden Formel:

Wahrscheinlichkeit in Excel für logistische Regression

Schritt 6: Erstellen Sie Werte für die Protokollwahrscheinlichkeit.

Als Nächstes erstellen wir Werte für die Protokollwahrscheinlichkeit mithilfe der folgenden Formel:

Logistische Regression in Excel

Schritt 7: Ermitteln Sie die Summe der Protokollwahrscheinlichkeiten.

Zuletzt finden wir die Summe der Log-Likehood Spalte. Dies ist die Zahl, die wir zu maximieren versuchen, um die Regressionskoeffizienten zu ermitteln.

Log-Likehood Spalte Excel

Schritt 8: Verwenden Sie den Solver, um nach den Regressionskoeffizienten zu suchen.

Wenn Sie den Solver noch nicht in Excel installiert haben, führen Sie dazu die folgenden Schritte aus:

  • Klicken Sie auf Datei.
  • Klicken Sie auf Optionen.
  • Klicken Sie auf Add-Ins.
  • Klicken Sie auf Solver-Add-In und dann auf OK.
  • Aktivieren Sie im neuen Fenster das Kontrollkästchen neben Solver-Add-In und klicken Sie dann auf OK.

Wechseln Sie nach der Installation des Solvers zur Gruppe Analyse auf der Registerkarte Daten und klicken Sie auf Solver. Geben Sie die folgenden Informationen ein:

  • Ziel festlegen: Wählen Sie die Zelle H14 aus, die die Summe der Protokollwahrscheinlichkeiten enthält.
  • Durch Ändern von Variablenzellen: Wählen Sie den Zellbereich B15:B18, der die Regressionskoeffizienten enthält.
  • Nicht eingeschränkte Variablen als nicht-negativ festlegen: Deaktivieren Sie dieses Kontrollkästchen.
  • Lösungsmethode auswählen: Wählen Sie GRG-Nichtlinear.

Klicken Sie dann auf Lösen.

Löser für logistisches Regressionsmodell in Excel

Der Solver berechnet automatisch die Schätzungen des Regressionskoeffizienten:

Logistische Regressionskoeffizienten in Excel

Standardmäßig können die Regressionskoeffizienten verwendet werden, um die Wahrscheinlichkeit zu ermitteln, dass der Draft = 0 ist. In der Regel interessiert uns jedoch bei der logistischen Regression die Wahrscheinlichkeit, dass die Antwortvariable = 1 ist. Daher können wir einfach die Vorzeichen auf jedem der Zeichen umkehren Regressionskoeffizienten:

Logistische Regressionsausgabe in Excel

Diese Regressionskoeffizienten können nun verwendet werden, um die Wahrscheinlichkeit zu ermitteln, dass Draft = 1 ist.

Angenommen, ein Spieler erzielt durchschnittlich 14 Punkte pro Spiel, 4 Rebounds pro Spiel und 5 Assists pro Spiel. Die Wahrscheinlichkeit, dass dieser Spieler in die NBA eingezogen wird, kann wie folgt berechnet werden:

P(Draft = 1) = e 3,681193 + 0,112827 * (14) -0,39568 * (4) – 0,67954 * (5) / (1 + e 3,681193 + 0,112827 * (14) -0,39568 * (4) – 0,67954 * (5) ) ) = 0,57.

Da diese Wahrscheinlichkeit größer als 0,5 ist, sagen wir voraus, dass dieser Spieler in die NBA eingezogen werden würde.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: