Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Die einfache lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer Prädiktorvariablen und einer Antwortvariablen verstehen können.
In diesem Tutorial wird erklärt, wie Sie eine einfache lineare Regression in SPSS durchführen.
Angenommen, wir haben den folgenden Datensatz, der die Anzahl der untersuchten Stunden und die Prüfungsergebnisse von 20 Studenten zeigt:
Führen Sie die folgenden Schritte aus, um eine einfache lineare Regression für diesen Datensatz durchzuführen und die Beziehung zwischen den untersuchten Stunden und dem Prüfungsergebnis zu quantifizieren:
Schritt 1: Visualisieren Sie die Daten.
Zunächst erstellen wir ein Streudiagramm, um die Beziehung zwischen Stunden und Punktzahl zu visualisieren und sicherzustellen, dass die Beziehung zwischen den beiden Variablen linear zu sein scheint. Andernfalls ist eine einfache lineare Regression keine geeignete Technik.
Klicken Sie auf die Registerkarte Diagramme, klicken Sie dann auf Diagrammerstellung:
Klicken Sie im Menü Auswählen aus und ziehen Sie Streuung / Punkt in das Hauptbearbeitungsfenster. Ziehen Sie dann die variablen Stunden auf die x-Achse und punkten Sie auf die y-Achse.
Sobald Sie auf OK klicken, wird das folgende Streudiagramm angezeigt:
Aus der Darstellung können wir ersehen, dass es eine positive lineare Beziehung zwischen Stunden und Punktzahl gibt. Im Allgemeinen erhalten Schüler, die länger studieren, tendenziell höhere Punktzahlen.
Da zwischen den beiden Variablen eine klare lineare Beziehung besteht, werden wir ein einfaches lineares Regressionsmodell an den Datensatz anpassen.
Schritt 2: Passen Sie ein einfaches lineares Regressionsmodell an.
Klicken Sie auf die Registerkarte Analysieren, dann auf Regression und dann auf Linear:
Ziehen Sie im neuen Fenster, das angezeigt wird, die variable Punktzahl in das Feld „Abhängig“ und die Stunden in das Feld „Unabhängig“. Klicken Sie dann auf OK.
Schritt 3: Interpretieren Sie die Ergebnisse.
Sobald Sie auf OK klicken, werden die Ergebnisse der einfachen linearen Regression angezeigt. Die erste Tabelle, die uns interessiert, ist die mit dem Titel Model Summary:
So interpretieren Sie die wichtigsten Zahlen in dieser Tabelle:
Die nächste Tabelle, die uns interessiert, trägt den Titel Coefficients:
So interpretieren Sie die wichtigsten Zahlen in dieser Tabelle:
Zuletzt können wir eine Regressionsgleichung unter Verwendung der Werte für constant und hours bilden. In diesem Fall wäre die Gleichung:
Geschätzte Prüfungspunktzahl = 73,662 + 3,342 * (Stunden)
Wir können diese Gleichung verwenden, um die geschätzte Prüfungspunktzahl für einen Schüler basierend auf der Anzahl der Stunden zu ermitteln, die er studiert hat. Zum Beispiel wird von einem Studenten, der 3 Stunden studiert, erwartet, dass er eine Prüfungsnote von 83.688 erhält:
Geschätzte Prüfungspunktzahl = 73,662 + 3,342 * (3) = 83,688
Schritt 4: Ergebnisse.
Zuletzt möchten wir die Ergebnisse unserer einfachen linearen Regression zusammenfassen. Hier ist ein Beispiel dafür:
Eine einfache lineare Regression wurde durchgeführt, um die Beziehung zwischen den untersuchten Stunden und dem erhaltenen Prüfungsergebnis zu quantifizieren. Bei der Analyse wurde eine Stichprobe von 20 Studenten verwendet.
Die Ergebnisse zeigten, dass es eine statistisch signifikante Beziehung zwischen den untersuchten Stunden und dem Prüfungsergebnis (t = 4,297, p <0,000) gab und dass die untersuchten Stunden 50,6% der erklärten Variabilität des Prüfungsergebnisses ausmachten.
Die Regressionsgleichung lautete wie folgt:
Geschätzte Prüfungspunktzahl = 73,662 + 3,342 * (Stunden)
Jede weitere untersuchte Stunde ist mit einer durchschnittlichen Erhöhung der Prüfungspunktzahl um 3,342 verbunden.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …