So führen Sie eine einfache lineare Regression in SPSS durch

Von Fabian
Kategorie: SPSS
Tags: Regression
Lesezeit: 4 Minuten

Die einfache lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer Prädiktorvariablen und einer Antwortvariablen verstehen können.

In diesem Tutorial wird erklärt, wie Sie eine einfache lineare Regression in SPSS durchführen.

Beispiel: Einfache lineare Regression in SPSS

Angenommen, wir haben den folgenden Datensatz, der die Anzahl der untersuchten Stunden und die Prüfungsergebnisse von 20 Studenten zeigt:

Datensatz

Führen Sie die folgenden Schritte aus, um eine einfache lineare Regression für diesen Datensatz durchzuführen und die Beziehung zwischen den untersuchten Stunden und dem Prüfungsergebnis zu quantifizieren:

Schritt 1: Visualisieren Sie die Daten.

Zunächst erstellen wir ein Streudiagramm, um die Beziehung zwischen Stunden und Punktzahl zu visualisieren und sicherzustellen, dass die Beziehung zwischen den beiden Variablen linear zu sein scheint. Andernfalls ist eine einfache lineare Regression keine geeignete Technik.

Klicken Sie auf die Registerkarte Diagramme, klicken Sie dann auf Diagrammerstellung:

Diagramm erstellen in SPSS

Klicken Sie im Menü Auswählen aus und ziehen Sie Streuung / Punkt in das Hauptbearbeitungsfenster. Ziehen Sie dann die variablen Stunden auf die x-Achse und punkten Sie auf die y-Achse.

Streudiagramm erstellen in SPSS

Sobald Sie auf OK klicken, wird das folgende Streudiagramm angezeigt:

Streudiagramm in SPSS

Aus der Darstellung können wir ersehen, dass es eine positive lineare Beziehung zwischen Stunden und Punktzahl gibt. Im Allgemeinen erhalten Schüler, die länger studieren, tendenziell höhere Punktzahlen.

Da zwischen den beiden Variablen eine klare lineare Beziehung besteht, werden wir ein einfaches lineares Regressionsmodell an den Datensatz anpassen.

Schritt 2: Passen Sie ein einfaches lineares Regressionsmodell an.

Klicken Sie auf die Registerkarte Analysieren, dann auf Regression und dann auf Linear:

Option für lineare Regression in SPSS

Ziehen Sie im neuen Fenster, das angezeigt wird, die variable Punktzahl in das Feld „Abhängig“ und die Stunden in das Feld „Unabhängig“. Klicken Sie dann auf OK.

Lineare Regression in SPSS

Schritt 3: Interpretieren Sie die Ergebnisse.

Sobald Sie auf OK klicken, werden die Ergebnisse der einfachen linearen Regression angezeigt. Die erste Tabelle, die uns interessiert, ist die mit dem Titel Model Summary:

Modellzusammenfassungstabelle in SPSS

So interpretieren Sie die wichtigsten Zahlen in dieser Tabelle:

  • R Square: Dies ist der Anteil der Varianz in der Antwortvariablen, der durch die erklärende Variable erklärt werden kann. In diesem Beispiel können 50,6% der Abweichungen bei den Prüfungsergebnissen durch die untersuchten Stunden erklärt werden.
  • Std. Error of Estimate: Der Standardfehler ist der durchschnittliche Abstand, um den die beobachteten Werte von der Regressionslinie fallen. In diesem Beispiel fallen die beobachteten Werte durchschnittlich um 5,861 Einheiten von der Regressionslinie ab.

Die nächste Tabelle, die uns interessiert, trägt den Titel Coefficients:

Koeffiziententabelle SPSS

So interpretieren Sie die wichtigsten Zahlen in dieser Tabelle:

  • Unstandardized B (Constant): Dies gibt den Durchschnittswert der Antwortvariablen an, wenn die Prädiktorvariable Null ist. In diesem Beispiel beträgt die durchschnittliche Prüfungspunktzahl 73,662, wenn die untersuchten Stunden gleich Null sind.
  • Unstandardized B (hours): Dies gibt die durchschnittliche Änderung der Antwortvariablen an, die mit einer Erhöhung der Prädiktorvariablen um eine Einheit verbunden ist. In diesem Beispiel ist jede weitere untersuchte Stunde mit einer durchschnittlichen Erhöhung der score um 3,342 verbunden.
  • Sig (hours): Dies ist der p-Wert, der der Teststatistik für Stunden zugeordnet ist. In diesem Fall können wir, da dieser Wert weniger als 0,05 beträgt, schließen, dass die variable hours des Prädiktors statistisch signifikant ist.

Zuletzt können wir eine Regressionsgleichung unter Verwendung der Werte für constant und hours bilden. In diesem Fall wäre die Gleichung:

Geschätzte Prüfungspunktzahl = 73,662 + 3,342 * (Stunden)

Wir können diese Gleichung verwenden, um die geschätzte Prüfungspunktzahl für einen Schüler basierend auf der Anzahl der Stunden zu ermitteln, die er studiert hat. Zum Beispiel wird von einem Studenten, der 3 Stunden studiert, erwartet, dass er eine Prüfungsnote von 83.688 erhält:

Geschätzte Prüfungspunktzahl = 73,662 + 3,342 * (3) = 83,688

Schritt 4: Ergebnisse.

Zuletzt möchten wir die Ergebnisse unserer einfachen linearen Regression zusammenfassen. Hier ist ein Beispiel dafür:

Eine einfache lineare Regression wurde durchgeführt, um die Beziehung zwischen den untersuchten Stunden und dem erhaltenen Prüfungsergebnis zu quantifizieren. Bei der Analyse wurde eine Stichprobe von 20 Studenten verwendet.

Die Ergebnisse zeigten, dass es eine statistisch signifikante Beziehung zwischen den untersuchten Stunden und dem Prüfungsergebnis (t = 4,297, p <0,000) gab und dass die untersuchten Stunden 50,6% der erklärten Variabilität des Prüfungsergebnisses ausmachten.

Die Regressionsgleichung lautete wie folgt:

Geschätzte Prüfungspunktzahl = 73,662 + 3,342 * (Stunden)

Jede weitere untersuchte Stunde ist mit einer durchschnittlichen Erhöhung der Prüfungspunktzahl um 3,342 verbunden.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: