Standardisierte Residuen in Excel berechnen - so geht's

Von Fabian
Kategorie: Excel
Tags: Regression
Lesezeit: 3 Minuten

Ein Residuum ist die Differenz zwischen einem beobachteten Wert und einem vorhergesagten Wert in einem Regressionsmodell.

Es wird berechnet als:

Residuum = Beobachteter Wert – Vorhergesagter Wert

Wenn wir die beobachteten Werte darstellen und die angepasste Regressionslinie überlagern, wären die Residuen für jede Beobachtung der vertikale Abstand zwischen der Beobachtung und der Regressionslinie:

Beispiel für Residuen in der Statistik

Eine Art von Residuum, das wir häufig verwenden, um Ausreißer in einem Regressionsmodell zu identifizieren, ist als standardisiertes Residuum bekannt.

Es wird berechnet als:

r i = e i / s(e i ) = e i / RSE√1-hii

wo:

  • e i: Das i-te Residuum
  • RSE: Der Standardfehler der Residuen des Modells
  • h ii: Die Hebelwirkung der i-ten Beobachtung

In der Praxis betrachten wir jedes standardisierte Residuum mit einem absoluten Wert größer als 3 oft als Ausreißer.

Dieses Tutorial bietet ein schrittweises Beispiel für die Berechnung von standardisierten Residuen in Excel.

Schritt 1: Geben Sie die Daten ein

Zuerst geben wir die Werte für einen kleinen Datensatz in Excel ein:

Sred

Schritt 2: Berechnen Sie die Reste

Als Nächstes gehen wir im oberen Menüband zur Registerkarte Daten und klicken in der Gruppe Analyse auf Datenanalyse:

Zweisampleexcel

Wenn Sie dieses Add-In noch nicht installiert haben, sehen Sie sich dieses Tutorial an. Es ist einfach zu installieren und völlig kostenlos.

Nachdem Sie auf Datenanalyse geklickt haben, klicken Sie auf die Option Regression und dann auf OK. Geben Sie im neuen Fenster, das sich öffnet, die folgenden Informationen ein und klicken Sie auf OK:

(Die Analyse im untenstehenden Bild wurden mit einer englischsprachen Excel-Version erstellt. In der deutschen Version können die Begriffe abweichen.)

Sred

Das Residuum für jede Beobachtung wird in der Ausgabe angezeigt:

Rückstände in Excel

Kopieren Sie diese Residuen und fügen Sie sie in eine neue Spalte neben den Originaldaten ein:

Sred

Schritt 3: Berechnen Sie den Hebel

Als nächstes müssen wir die Hebelwirkung jeder Beobachtung berechnen.

Das folgende Bild zeigt, wie das geht:

Leverage-Berechnung in Excel für Statistiken

Hier sind die Formeln, die in den verschiedenen Zellen verwendet werden:

  • B14: =ANZAHL(B2:B13)
  • B15: =MITTELWERT(B2:B13)
  • B16: =SUMQUADABW(B2:B13)
  • E2: =1/$B$14+(B2-$B$15)^2/$B$16

Schritt 4: Berechnen Sie die standardisierten Residuen

Schließlich können wir die standardisierten Residuen mit der Formel berechnen:

r i = e i / RSE√1-hii

Die RSE für das Modell finden Sie in der Modellausgabe von vorher. Es stellt sich heraus, dass es 4,44 ist:

Sred

Daher können wir die folgende Formel verwenden, um das standardisierte Residuum für jede Beobachtung zu berechnen:

(Die Formeln im untenstehenden Bild wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)

Standardisierte Residuen in Excel

Aus den Ergebnissen können wir erkennen, dass keines der standardisierten Residuen einen absoluten Wert von 3 überschreitet. Somit scheint keine der Beobachtungen Ausreißer zu sein.

Es ist erwähnenswert, dass Forscher in einigen Fällen Beobachtungen mit standardisierten Residuen, die einen absoluten Wert von 2 überschreiten, als Ausreißer betrachten.

Es liegt an Ihnen zu entscheiden, ob Sie einen absoluten Wert von 2 oder 3 als Schwellenwert für Ausreißer verwenden, abhängig von dem spezifischen Problem, an dem Sie arbeiten.

Zusätzliche Ressourcen

Standardisierte Residuen direkt berechnen mit dem Standardisierte Residuen - Rechner
Einführung in die multiple lineare Regression

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: