Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Multikollinearität in der Regressionsanalyse tritt auf, wenn zwei oder mehr Prädiktorvariablen stark miteinander korreliert sind, sodass sie keine eindeutigen oder unabhängigen Informationen im Regressionsmodell liefern. Wenn der Korrelationsgrad zwischen Variablen hoch genug ist, kann dies zu Problemen beim Anpassen und Interpretieren des Regressionsmodells führen.
Eine Möglichkeit zur Erkennung der Multikollinearität ist die Verwendung einer Metrik, die als Varianzinflationsfaktor (VIF) bezeichnet wird und die Korrelation und Stärke der Korrelation zwischen den Prädiktorvariablen in einem Regressionsmodell misst.
In diesem Artikel wird erläutert, wie Sie mithilfe von VIF Multikollinearität in einer Regressionsanalyse in SPSS erkennen.
Angenommen, wir haben den folgenden Datensatz, der die Prüfungsergebnisse von 10 Studenten zusammen mit der Anzahl der Stunden, die sie verbracht haben, der Anzahl der Vorbereitungsprüfungen und ihrer aktuellen Note im Kurs zeigt:
Wir möchten eine lineare Regression durchführen, bei der score als Antwortvariable und hours, prep_exams und current_grade als Prädiktorvariablen verwendet werden. Wir möchten jedoch sicherstellen, dass die drei Prädiktorvariablen nicht stark korrelieren.
Um festzustellen, ob Multikollinearität ein Problem darstellt, können wir für jede der Prädiktorvariablen VIF-Werte erstellen.
Klicken Sie dazu auf die Registerkarte Analysieren, dann auf Regression und dann auf Linear:
Ziehen Sie in dem neuen Fenster, das angezeigt wird, die Punktzahl in das Feld Abhängig und die drei Prädiktorvariablen in das Feld Unabhängig (e). Klicken Sie dann auf Statistik und stellen Sie sicher, dass das Kontrollkästchen neben Kollinearitätsdiagnose aktiviert ist. Klicken Sie dann auf Weiter. Klicken Sie dann auf OK.
Sobald Sie auf OK klicken, wird die folgende Tabelle angezeigt, in der der VIF-Wert für jede Prädiktorvariable angezeigt wird:
Die VIF-Werte für jede der Prädiktorvariablen sind wie folgt:
Der Wert für VIF beginnt bei 1 und hat keine Obergrenze. Eine allgemeine Faustregel für die Interpretation von VIFs lautet wie folgt:
Wir können sehen, dass keiner der VIF-Werte für die Prädiktorvariablen in diesem Beispiel größer als 5 ist, was darauf hinweist, dass Multikollinearität im Regressionsmodell kein Problem darstellt.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …