So führen Sie einen partiellen F-Test in Excel durch

Von Fabian
Kategorie: Excel
Tags: Regression
Lesezeit: 3 Minuten

Ein partieller F-Test wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen einem Regressionsmodell und einer verschachtelten Version desselben Modells besteht.

Ein verschachteltes Modell ist einfach eines, das eine Teilmenge der Prädiktorvariablen im Gesamtregressionsmodell enthält.

Angenommen, wir haben das folgende Regressionsmodell mit vier Prädiktorvariablen:

Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε

Ein Beispiel für ein verschachteltes Modell wäre das folgende Modell mit nur zwei der ursprünglichen Prädiktorvariablen:

Y = β 0 + β 1 x 1 + β 2 x 2 + ε

Um festzustellen, ob sich diese beiden Modelle signifikant unterscheiden, können wir einen partiellen F-Test durchführen, der die folgende F-Test-Statistik berechnet:

F = ((RSS reduced – RSS full )/p) / (RSS full /n-k)

wo:

  • RSSreduced: Die Residuenquadratsumme des reduzierten (d.h. „verschachtelten“) Modells.
  • RSSfull: Die Residuenquadratsumme des vollständigen Modells.
  • p: Die Anzahl der Prädiktoren, die aus dem vollständigen Modell entfernt wurden.
  • n: Die Gesamtzahl der Beobachtungen im Datensatz.
  • k: Die Anzahl der Koeffizienten (einschließlich des Achsenabschnitts) im vollständigen Modell.

Dieser Test verwendet die folgenden null und alternative Hypothesen :

H 0: Alle aus dem vollständigen Modell entfernten Koeffizienten sind null.

H A: Mindestens einer der aus dem vollständigen Modell entfernten Koeffizienten ist ungleich Null.

Wenn der der F-Teststatistik entsprechende p-Wert unter einem bestimmten Signifikanzniveau (z.B. 0,05) liegt, können wir die Nullhypothese verwerfen und schlussfolgern, dass mindestens einer der aus dem vollständigen Modell entfernten Koeffizienten signifikant ist.

Das folgende Beispiel zeigt, wie Sie einen partiellen F-Test in Excel durchführen.

Beispiel: Teilweiser F-Test in Excel

Angenommen, wir haben den folgenden Datensatz in Excel:

Teilfexcel

Angenommen, wir möchten feststellen, ob es einen Unterschied zwischen den folgenden beiden Regressionsmodellen gibt:

Vollständiges Modell: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4

Reduziertes Modell: y = β 0 + β 1 x 1 + β 2 x 2

Wir können mit der Durchführung multipler linearer Regressionen in Excel für jedes Modell fortfahren, um die folgende Ausgabe zu erhalten:

Teilfexcel

Wir können dann die folgende Formel verwenden, um die F-Test-Statistik für den partiellen F-Test zu berechnen:

Teilfexcel

Die Teststatistik ergibt 2.064.

Wir können dann die folgende Formel verwenden, um den entsprechenden p-Wert zu berechnen:

Teilfexcel

Der p-Wert beträgt 0,1974.

Da dieser p-Wert nicht kleiner als 0,05 ist, werden wir die Nullhypothese nicht verwerfen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass eine der Prädiktorvariablen x3 oder x4 statistisch signifikant ist.

Mit anderen Worten, das Hinzufügen von x3 und x4 zum Regressionsmodell verbessert die Anpassung des Modells nicht signifikant.

Zusätzliche Ressourcen

So führen Sie eine einfache lineare Regression in Excel durch
So führen Sie mehrere lineare Regressionen in Excel durch
So berechnen Sie den Standardfehler der Regression in Excel

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: