So erstellen Sie ein Vorhersageintervall in Excel

Von Fabian
Kategorie: Excel
Tags: Regression
Lesezeit: 3 Minuten

In der Statistik ist die einfache lineare Regression eine Technik, mit der wir die Beziehung zwischen einer Prädiktorvariablen x und einer Antwortvariablen y quantifizieren können.

Wenn wir eine einfache lineare Regression durchführen, erhalten wir eine „Linie der besten Anpassung“, die die Beziehung zwischen x und y beschreibt. Diese kann wie folgt geschrieben werden:

ŷ = b 0 + b 1 x

wo:

  • ŷ ist der vorhergesagte Wert der Antwortvariablen
  • b 0 ist der y-Achsenabschnitt
  • b 1 ist der Regressionskoeffizient
  • x ist der Wert der Prädiktorvariablen

Manchmal sind wir daran interessiert, diese Linie der besten Anpassung zu verwenden, um ein Vorhersageintervall für einen gegebenen Wert von x 0 zu konstruieren, das ein Intervall um den vorhergesagten Wert ŷ 0 ist, so dass eine Wahrscheinlichkeit von 95% besteht, dass der reale Wert von y in Die Population, die x 0 entspricht, liegt innerhalb dieses Intervalls.

Die Formel zur Berechnung des Vorhersageintervalls für einen bestimmten Wert x 0 lautet wie folgt:

ŷ 0 +/- t α / 2, df = n-2 * se

wo:

  • se = S yx √ (1 + 1 / n + (x 0 – x ) 2 / SS x )

Die Formel mag ein wenig einschüchternd aussehen, aber die Berechnung in Excel ist eigentlich unkompliziert. Als Nächstes werden wir ein Beispiel für die Verwendung dieser Formel zur Berechnung eines Vorhersageintervalls für einen bestimmten Wert in Excel durchgehen.

Beispiel: Erstellen eines Vorhersageintervalls in Excel

Der folgende Datensatz zeigt die Anzahl der Stunden, die zusammen mit der Prüfungsnote von 15 verschiedenen Studenten studiert wurden:

Beispieldatensatz in Excel

Angenommen, wir möchten ein Vorhersageintervall von 95% für den Wert x 0 = 3 erstellen. Das heißt, wir möchten ein Intervall erstellen, bei dem eine Wahrscheinlichkeit von 95% besteht, dass die Prüfungsergebnisse für einen Studenten, für den studiert wird, innerhalb dieses Intervalls liegen 3 Stunden.

Der folgende Screenshot zeigt, wie alle erforderlichen Werte berechnet werden, um dieses Vorhersageintervall zu erhalten.

Hinweis: Die Formeln in Spalte F zeigen, wie die Werte in Spalte E berechnet wurden.

(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)

So berechnen Sie ein Vorhersageintervall in Excel

Das 95%-Vorhersageintervall für einen Wert von x 0 = 3 beträgt (74,64, 86,90). Das heißt, wir sagen mit einer Wahrscheinlichkeit von 95% voraus, dass ein Student, der 3 Stunden studiert, eine Punktzahl zwischen 74,64 und 86,90 erreicht.

Ein paar Anmerkungen zu den verwendeten Berechnungen:

  • Um den t-kritischen Wert von t α / 2, df = n-2, zu berechnen , verwendeten wir α / 2 = 0,05 / 2 = 0,25, da wir ein Vorhersageintervall von 95% wollten. Beachten Sie, dass höhere Vorhersageintervalle (z. B. 99% Vorhersageintervall) zu größeren Intervallen führen. Umgekehrt führt ein niedrigeres Vorhersageintervall (z. B. 90% Vorhersageintervall) zu einem engeren Intervall.
  • Wir haben die Formel =PROGNOSE() verwendet, um den vorhergesagten Wert für ŷ 0 zu erhalten, aber die Formel =PROGNOSE.LINEAR() gibt genau den gleichen Wert zurück.
Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: