Wir verwenden oft drei verschiedene Quadratsummenwerte, um zu messen, wie gut eine Regressionslinie tatsächlich zu einem Datensatz passt:

1. Totale Quadratsumme (SST) – Die Summe der quadrierten Differenzen zwischen einzelnen Datenpunkten (y i ) und dem Mittelwert der Antwortvariablen ( y ).

  • SST = Σ(y iy ) 2

2. Residuenquadratsumme (SSR) – Die Summe der quadrierten Differenzen zwischen vorhergesagten Datenpunkten (ŷ i ) und dem Mittelwert der Antwortvariablen ( y ).

  • SSR = Σ(ŷ iy ) 2

3. Quadratsummenfehler (SSE) – Die Summe der quadrierten Differenzen zwischen vorhergesagten Datenpunkten (ŷ i ) und beobachteten Datenpunkten (y i ).

  • SSE = Σ(ŷ i – y i ) 2

Das folgende Schritt-für-Schritt-Beispiel zeigt, wie jede dieser Metriken für ein bestimmtes Regressionsmodell in Excel berechnet wird.

Schritt 1: Erstellen Sie die Daten

Lassen Sie uns zunächst einen Datensatz erstellen, der die Anzahl der studierten Stunden und das Prüfungsergebnis von 20 verschiedenen Schülern an einer bestimmten Schule enthält:

Summenquadratexcel

Schritt 2: Anpassen eines Regressionsmodells

Klicken Sie im oberen Menüband in Excel auf die Registerkarte Daten und dann auf Datenanalyse. Wenn diese Option nicht angezeigt wird, müssen Sie zuerst das kostenlose Analysis ToolPak installieren.

Datenanalyseoption in Excel

Sobald Sie auf Datenanalyse klicken, öffnet sich ein neues Fenster. Wählen Sie Regression und klicken Sie auf OK.

Geben Sie im neuen Fenster, das angezeigt wird, die folgenden Informationen ein:

Summenquadratexcel

Sobald Sie auf OK klicken, wird die Regressionsausgabe angezeigt.

Summenquadratexcel

Schritt 3: Analysieren Sie die Ausgabe

Die drei Quadratsummenmetriken – SST, SSR und SSE – sind in der SS-Spalte der ANOVA-Tabelle zu sehen:

SST, SSR und SSE in Excel

Als Metriken stellen sich heraus:

  • Totale Quadratsumme (SST): 1248,55
  • Residuenquadratsumme (SSR): 917.4751
  • Quadratsummenfehler (SSE): 331,0749

Wir können überprüfen, dass SST = SSR + SSE:

  • SST = SSR + SSE
  • 1248,55 = 917,4751 + 331,0749

Wir können das R-Quadrat des Regressionsmodells auch manuell berechnen:

  • R-Quadrat = SSR / SST
  • R-Quadrat = 917,4751 / 1248,55
  • R-Quadrat = 0,7348

Dies sagt uns, dass 73,48 % der Unterschiede in den Prüfungsergebnissen durch die Anzahl der studierten Stunden erklärt werden können.

Zusätzliche Ressourcen

So führen Sie eine einfache lineare Regression in Excel durch
So führen Sie mehrere lineare Regressionen in Excel durch
So führen Sie eine polynomielle Regression in Excel durch
So führen Sie eine exponentielle Regression in Excel durch

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: