Durchführen einer multiple linearen Regression in SPSS

Von Fabian
Kategorie: SPSS
Tags: Regression
Lesezeit: 4 Minuten

Die multiple lineare Regression ist eine Methode, mit der wir die Beziehung zwischen zwei oder mehr erklärenden Variablen und einer Antwortvariablen verstehen können.

In diesem Tutorial wird erläutert, wie Sie in SPSS eine multiple lineare Regression durchführen.

Beispiel: Multiple lineare Regression in SPSS

Angenommen, wir möchten wissen, ob die Anzahl der Stunden des Studiums und die Anzahl der vorbereiteten Prüfungen die Punktzahl beeinflusst, die ein Schüler für eine bestimmte Prüfung erhält. Um dies zu untersuchen, können wir mithilfe der folgenden Variablen mehrere lineare Regressionen durchführen:

Erklärende Variablen:

  • Hours studied (dt. Stunden studiert)
  • Prep exams taken (dt. Vorbereitungsprüfungen abgelegt)

Antwortvariable:

  • Exam score (dt. Prüfungsergebnis)

Führen Sie die folgenden Schritte aus, um diese multiple lineare Regression in SPSS durchzuführen.

Schritt 1: Geben Sie die Daten ein.

Geben Sie die folgenden Daten für die Anzahl der Stunden, die vorbereiteten Prüfungen und die Prüfungsergebnisse für 20 Studenten ein:

Datengrundlage

Schritt 2: Führen Sie eine multiple lineare Regression durch.

Klicken Sie auf die Registerkarte Analysieren, dann auf Regression und dann auf Linear:

Multiple lineare Regression in SPSS

Ziehen Sie die Variable score in das Feld Abhängig. Ziehen Sie die Variablen hours und prep_exams in das Feld Unabhängige(n). Klicken Sie dann auf OK.

Beispiel für eine multiple lineare Regression in SPSS

Schritt 3: Interpretieren Sie die Ausgabe.

Sobald Sie auf OK klicken, werden die Ergebnisse der multiplen linearen Regression in einem neuen Fenster angezeigt.

Die erste Tabelle, die uns interessiert, trägt den Titel Model Summary:

Modellzusammenfassungsausgabe der Regression in SPSS

So interpretieren Sie die wichtigsten Zahlen in dieser Tabelle:

  • R Square: Dies ist der Anteil der Varianz in der Antwortvariablen, der durch die erklärenden Variablen erklärt werden kann. In diesem Beispiel können 73,4% der Abweichungen bei den Prüfungsergebnissen durch die untersuchten Stunden und die Anzahl der vorbereiteten Prüfungen erklärt werden.
  • Std. Error of Estimate: Der Standardfehler ist der durchschnittliche Abstand, um den die beobachteten Werte von der Regressionslinie fallen. In diesem Beispiel fallen die beobachteten Werte durchschnittlich um 5,3657 Einheiten von der Regressionslinie ab.

Die nächste Tabelle an der wir interessiert sind trägt den Titel ANOVA:

ANOVA-Ausgabetabelle für die Regression in SPSS

So interpretieren Sie die wichtigsten Zahlen in dieser Tabelle:

  • F: Dies ist die Gesamt-F-Statistik für das Regressionsmodell, berechnet als Mean Square Regression / Mean Square Residual.
  • Sig: Dies ist der p-Wert, der der gesamten F-Statistik zugeordnet ist. Es zeigt uns, ob das Regressionsmodell insgesamt statistisch signifikant ist oder nicht. Mit anderen Worten, es sagt uns, ob die beiden erklärenden Variablen zusammen eine statistisch signifikante Assoziation mit der Antwortvariablen haben. In diesem Fall ist der p-Wert gleich 0,000, was darauf hinweist, dass die erklärenden Variablen Stunden untersucht und Vorbereitungsprüfungen eine statistisch signifikante Assoziation mit dem Prüfungsergebnis haben.

Die nächste Tabelle, die uns interessiert, trägt den Titel Coefficients:

Koeffiziente Ausgabe der multiplen linearen Regression in SPSS

So interpretieren Sie die wichtigsten Zahlen in dieser Tabelle:

  • Unstandardized B (Constant): Dies gibt den Durchschnittswert der Antwortvariablen an, wenn beide Prädiktorvariablen Null sind. In diesem Beispiel beträgt die durchschnittliche Prüfungspunktzahl 67,674, wenn die Stunden und die vorbereiteten Prüfungen gleich Null sind.
  • Unstandardized B (hours): Dies gibt Auskunft über die durchschnittliche Änderung der Prüfungsergebnisse, die mit einer Erhöhung der untersuchten Stunden um eine Einheit verbunden ist, vorausgesetzt, die Anzahl der absolvierten Vorbereitungsprüfungen wird konstant gehalten. In diesem Fall ist jede zusätzliche Unterrichtsstunde mit einer Erhöhung der Prüfungspunktzahl um 5,556 Punkte verbunden, vorausgesetzt, die Anzahl der vorbereiteten Prüfungen wird konstant gehalten.
  • Unstandardized B (prep_exams): Dies gibt Auskunft über die durchschnittliche Änderung der Prüfungsergebnisse, die mit einer Erhöhung der vorbereiteten Prüfungen um eine Einheit verbunden ist, vorausgesetzt, die Anzahl der untersuchten Stunden wird konstant gehalten. In diesem Fall ist jede zusätzliche Vorbereitungsprüfung mit einer Abnahme der score um 0,602 Punkte verbunden, vorausgesetzt, die Anzahl der untersuchten Stunden wird konstant gehalten.
  • Sig. (hours): Dies ist der p-Wert für die erklärende Variable hours. Da dieser Wert (.000) kleiner als .05 ist, können wir schließen, dass die untersuchten Stunden einen statistisch signifikanten Zusammenhang mit dem Prüfungsergebnis haben.
  • Sig.(prep_exams): Dies ist der p-Wert für die erklärende Variable prep_exams. Da dieser Wert (.519) nicht kleiner als .05 ist, können wir nicht schließen, dass die Anzahl der absolvierten Vorbereitungsprüfungen einen statistisch signifikanten Zusammenhang mit dem Prüfungsergebnis aufweist.

Zuletzt können wir eine Regressionsgleichung unter Verwendung der in der Tabelle angegebenen Werte für constant, hours und prep_exams bilden. In diesem Fall wäre die Gleichung:

Geschätzte Prüfungspunktzahl = 67,674 + 5,556 * (hours) – 0,602 * (prep_exams)

Wir können diese Gleichung verwenden, um die geschätzte Prüfungspunktzahl für einen Schüler zu ermitteln, basierend auf der Anzahl der Stunden, die er studiert hat, und der Anzahl der Vorbereitungsprüfungen, die er abgelegt hat. Beispielsweise wird von einem Studenten, der 3 Stunden studiert und 2 Vorbereitungsprüfungen ablegt, eine Prüfungsnote von 83,1 erwartet:

Geschätzte Prüfungspunktzahl = 67,674 + 5,556 * (3) – 0,602 * (2) = 83,1

Hinweis:* Da festgestellt wurde, dass die Vorbereitungsprüfungen für erklärende Variablen statistisch nicht signifikant sind, können wir sie aus dem Modell entfernen und stattdessen eine einfache lineare Regression unter Verwendung der untersuchten Stunden* als einzige erklärende Variable durchführen.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: