Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Ein partieller F-Test wird verwendet, um zu bestimmen, ob ein statistisch signifikanter Unterschied zwischen einem Regressionsmodell und einer verschachtelten Version desselben Modells besteht.
Ein verschachteltes Modell ist einfach eines, das eine Teilmenge der Prädiktorvariablen im Gesamtregressionsmodell enthält.
Angenommen, wir haben das folgende Regressionsmodell mit vier Prädiktorvariablen:
Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε
Ein Beispiel für ein verschachteltes Modell wäre das folgende Modell mit nur zwei der ursprünglichen Prädiktorvariablen:
Y = β 0 + β 1 x 1 + β 2 x 2 + ε
Um festzustellen, ob sich diese beiden Modelle signifikant unterscheiden, können wir einen partiellen F-Test durchführen, der die folgende F-Test-Statistik berechnet:
F = ((RSS reduced – RSS full )/p) / (RSS full /n-k)
wo:
Dieser Test verwendet die folgenden null und alternative Hypothesen :
H 0: Alle aus dem vollständigen Modell entfernten Koeffizienten sind null.
H A: Mindestens einer der aus dem vollständigen Modell entfernten Koeffizienten ist ungleich Null.
Wenn der der F-Teststatistik entsprechende p-Wert unter einem bestimmten Signifikanzniveau (z.B. 0,05) liegt, können wir die Nullhypothese verwerfen und schlussfolgern, dass mindestens einer der aus dem vollständigen Modell entfernten Koeffizienten signifikant ist.
Das folgende Beispiel zeigt, wie Sie einen partiellen F-Test in Excel durchführen.
Angenommen, wir haben den folgenden Datensatz in Excel:
Angenommen, wir möchten feststellen, ob es einen Unterschied zwischen den folgenden beiden Regressionsmodellen gibt:
Vollständiges Modell: y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4
Reduziertes Modell: y = β 0 + β 1 x 1 + β 2 x 2
Wir können mit der Durchführung multipler linearer Regressionen in Excel für jedes Modell fortfahren, um die folgende Ausgabe zu erhalten:
Wir können dann die folgende Formel verwenden, um die F-Test-Statistik für den partiellen F-Test zu berechnen:
Die Teststatistik ergibt 2.064.
Wir können dann die folgende Formel verwenden, um den entsprechenden p-Wert zu berechnen:
Der p-Wert beträgt 0,1974.
Da dieser p-Wert nicht kleiner als 0,05 ist, werden wir die Nullhypothese nicht verwerfen. Dies bedeutet, dass wir nicht genügend Beweise haben, um zu sagen, dass eine der Prädiktorvariablen x3 oder x4 statistisch signifikant ist.
Mit anderen Worten, das Hinzufügen von x3 und x4 zum Regressionsmodell verbessert die Anpassung des Modells nicht signifikant.
So führen Sie eine einfache lineare Regression in Excel durch
So führen Sie mehrere lineare Regressionen in Excel durch
So berechnen Sie den Standardfehler der Regression in Excel
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …