So testen Sie Multikollinearität in SPSS

Von Fabian
Kategorie: SPSS
Tags: Regression
Lesezeit: 3 Minuten

Multikollinearität in der Regressionsanalyse tritt auf, wenn zwei oder mehr Prädiktorvariablen stark miteinander korreliert sind, sodass sie keine eindeutigen oder unabhängigen Informationen im Regressionsmodell liefern. Wenn der Korrelationsgrad zwischen Variablen hoch genug ist, kann dies zu Problemen beim Anpassen und Interpretieren des Regressionsmodells führen.

Eine Möglichkeit zur Erkennung der Multikollinearität ist die Verwendung einer Metrik, die als Varianzinflationsfaktor (VIF) bezeichnet wird und die Korrelation und Stärke der Korrelation zwischen den Prädiktorvariablen in einem Regressionsmodell misst.

In diesem Artikel wird erläutert, wie Sie mithilfe von VIF Multikollinearität in einer Regressionsanalyse in SPSS erkennen.

Beispiel: Multikollinearität in SPSS

Angenommen, wir haben den folgenden Datensatz, der die Prüfungsergebnisse von 10 Studenten zusammen mit der Anzahl der Stunden, die sie verbracht haben, der Anzahl der Vorbereitungsprüfungen und ihrer aktuellen Note im Kurs zeigt:

Datengrundlage

Wir möchten eine lineare Regression durchführen, bei der score als Antwortvariable und hours, prep_exams und current_grade als Prädiktorvariablen verwendet werden. Wir möchten jedoch sicherstellen, dass die drei Prädiktorvariablen nicht stark korrelieren.

Um festzustellen, ob Multikollinearität ein Problem darstellt, können wir für jede der Prädiktorvariablen VIF-Werte erstellen.

Klicken Sie dazu auf die Registerkarte Analysieren, dann auf Regression und dann auf Linear:

Lineare Regression erstellen

Ziehen Sie in dem neuen Fenster, das angezeigt wird, die Punktzahl in das Feld Abhängig und die drei Prädiktorvariablen in das Feld Unabhängig (e). Klicken Sie dann auf Statistik und stellen Sie sicher, dass das Kontrollkästchen neben Kollinearitätsdiagnose aktiviert ist. Klicken Sie dann auf Weiter. Klicken Sie dann auf OK.

Lineare Regression erstellen 2

Sobald Sie auf OK klicken, wird die folgende Tabelle angezeigt, in der der VIF-Wert für jede Prädiktorvariable angezeigt wird:

VIF in SPSS

Die VIF-Werte für jede der Prädiktorvariablen sind wie folgt:

  • Stunden: 1.169
  • prep_exams: 1.403
  • current_grade: 1.522

Der Wert für VIF beginnt bei 1 und hat keine Obergrenze. Eine allgemeine Faustregel für die Interpretation von VIFs lautet wie folgt:

  • Ein Wert von 1 gibt an, dass keine Korrelation zwischen einer bestimmten Prädiktorvariablen und anderen Prädiktorvariablen im Modell besteht.
  • Ein Wert zwischen 1 und 5 zeigt eine moderate Korrelation zwischen einer bestimmten Prädiktorvariablen und anderen Prädiktorvariablen im Modell an, dies ist jedoch häufig nicht schwerwiegend genug, um Aufmerksamkeit zu erfordern.
  • Ein Wert größer als 5 zeigt eine möglicherweise schwerwiegende Korrelation zwischen einer bestimmten Prädiktorvariablen und anderen Prädiktorvariablen im Modell an. In diesem Fall sind die Koeffizientenschätzungen und p-Werte in der Regressionsausgabe wahrscheinlich unzuverlässig.

Wir können sehen, dass keiner der VIF-Werte für die Prädiktorvariablen in diesem Beispiel größer als 5 ist, was darauf hinweist, dass Multikollinearität im Regressionsmodell kein Problem darstellt.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: