Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Die logistische Regression ist eine statistische Methode, mit der wir ein Regressionsmodell anpassen, wenn die Antwortvariable binär ist.
In diesem Tutorial werden vier verschiedene Beispiele für die Verwendung der logistischen Regression im wirklichen Leben vorgestellt.
Medizinische Forscher möchten wissen, wie sich Bewegung und Gewicht auf die Wahrscheinlichkeit eines Herzinfarkts auswirken. Um die Beziehung zwischen den Prädiktorvariablen und der Wahrscheinlichkeit eines Herzinfarkts zu verstehen, können Forscher eine logistische Regression durchführen.
Die Antwortvariable im Modell ist Herzinfarkt und hat zwei mögliche Ergebnisse:
Die Ergebnisse des Modells zeigen den Forschern genau, wie sich Änderungen in Bewegung und Gewicht auf die Wahrscheinlichkeit auswirken, dass eine bestimmte Person einen Herzinfarkt hat. Die Forscher können auch das angepasste logistische Regressionsmodell verwenden, um die Wahrscheinlichkeit eines Herzinfarkts einer bestimmten Person basierend auf ihrem Gewicht und ihrer Trainingszeit vorherzusagen.
Die Forscher möchten wissen, wie sich GPA, ACT-Score und Anzahl der absolvierten AP-Klassen auf die Wahrscheinlichkeit auswirken, an einer bestimmten Universität aufgenommen zu werden. Um die Beziehung zwischen den Prädiktorvariablen und der Wahrscheinlichkeit der Akzeptanz zu verstehen, können Forscher eine logistische Regression durchführen.
Die Antwortvariable im Modell lautet „Akzeptanz“ und hat zwei mögliche Ergebnisse:
Die Ergebnisse des Modells zeigen den Forschern genau, wie sich Änderungen des GPA, des ACT-Scores und der Anzahl der absolvierten AP-Klassen auf die Wahrscheinlichkeit auswirken, dass eine bestimmte Person an der Universität aufgenommen wird. Die Forscher können auch das angepasste logistische Regressionsmodell verwenden, um die Wahrscheinlichkeit, dass eine bestimmte Person akzeptiert wird, basierend auf ihrem GPA, ACT-Score und der Anzahl der absolvierten AP-Klassen vorherzusagen.
Ein Unternehmen möchte wissen, ob die Anzahl der Wörter und das Herkunftsland die Wahrscheinlichkeit beeinflussen, dass eine E-Mail Spam ist. Um die Beziehung zwischen diesen beiden Prädiktorvariablen und der Wahrscheinlichkeit, dass eine E-Mail Spam ist, zu verstehen, können Forscher eine logistische Regression durchführen.
Die Antwortvariable im Modell ist „Spam“ und hat zwei mögliche Ergebnisse:
Die Ergebnisse des Modells zeigen dem Unternehmen genau, wie sich Änderungen der Wortanzahl und des Herkunftslandes auf die Wahrscheinlichkeit auswirken, dass eine bestimmte E-Mail Spam ist. Das Unternehmen kann auch das angepasste logistische Regressionsmodell verwenden, um die Wahrscheinlichkeit, dass eine bestimmte E-Mail Spam ist, basierend auf der Wortanzahl und dem Herkunftsland vorherzusagen.
Ein Kreditkartenunternehmen möchte wissen, ob sich der Transaktionsbetrag und die Kreditwürdigkeit auf die Wahrscheinlichkeit auswirken, dass eine bestimmte Transaktion betrügerisch ist. Um die Beziehung zwischen diesen beiden Prädiktorvariablen und der Wahrscheinlichkeit eines betrügerischen Geschäfts zu verstehen, kann das Unternehmen eine logistische Regression durchführen.
Die Antwortvariable im Modell ist „betrügerisch“ und hat zwei mögliche Ergebnisse:
Die Ergebnisse des Modells zeigen dem Unternehmen genau, wie sich Änderungen des Transaktionsbetrags und der Kreditwürdigkeit auf die Wahrscheinlichkeit auswirken, dass eine bestimmte Transaktion betrügerisch ist. Das Unternehmen kann auch das angepasste logistische Regressionsmodell verwenden, um die Wahrscheinlichkeit, dass eine bestimmte Transaktion betrügerisch ist, basierend auf dem Transaktionsbetrag und der Kreditwürdigkeit der Person, die die Transaktion durchgeführt hat, vorherzusagen.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …