Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Ein Breusch-Pagan-Test wird verwendet, um festzustellen, ob in einer Regressionsanalyse Heteroskedastizität vorliegt.
In diesem Tutorial wird erklärt, wie ein Breusch-Pagan-Test in R durchgeführt wird.
In diesem Beispiel passen wir ein Regressionsmodell unter Verwendung des integrierten R-Datensatzes mtcars an und führen dann einen Breusch-Pagan-Test unter Verwendung der bptest-Funktion aus der lmtest-Bibliothek durch, um festzustellen, ob Heteroskedastizität vorliegt.
Schritt 1: Passen Sie ein Regressionsmodell an.
Zunächst werden wir ein Regressionsmodell anpassen, das mpg als Antwortvariable und disp und hp als die beiden erklärenden Variablen verwendet.
#Laden Sie den Datensatz
data(mtcars)
#Regressionsmodell anpassen
model <- lm(mpg~disp+hp, data=mtcars)
#Modellzusammenfassung anzeigen
summary(model)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 30.735904 1.331566 23.083 < 2e-16 ***
disp -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679.
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Schritt 2: Führen Sie einen Breusch-Pagan-Test durch.
Als nächstes werden wir einen Breusch-Pagan-Test durchführen, um festzustellen, ob Heteroskedastizität vorliegt.
#lmtest Bibliothek laden
library(lmtest)
#Breusch-Pagan Test durchführen
bptest(model)
studentized Breusch-Pagan test
data: model
BP = 4.0861, df = 2, p-value = 0.1296
Die Teststatistik ist 4.0861 und der entsprechende p-Wert ist 0.1296. Da der p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Wir haben nicht genügend Beweise, um zu sagen, dass das Regressionsmodell Heteroskedastizität aufweist.
Wenn Sie die Nullhypothese des Breusch-Pagan-Tests nicht ablehnen, liegt keine Heteroskedastizität vor, und Sie können mit der Interpretation der Ausgabe der ursprünglichen Regression fortfahren.
Wenn Sie jedoch die Nullhypothese ablehnen, bedeutet dies, dass die Daten heteroskedastisch sind. In diesem Fall können die Standardfehler, die in der Ausgabetabelle der Regression angezeigt werden, unzuverlässig sein.
Es gibt einige gängige Möglichkeiten, um dieses Problem zu beheben, darunter:
1. Transformieren Sie die Antwortvariable.
Sie können versuchen, eine Transformation für die Antwortvariable durchzuführen. Beispielsweise könnten Sie log (Preis) anstelle von Preis als Antwortvariable verwenden. In der Regel ist das Protokoll der Antwortvariablen ein wirksames Mittel, um die Heteroskedastizität zu beseitigen. Eine andere übliche Transformation besteht darin, die Quadratwurzel der Antwortvariablen zu verwenden.
2. Verwenden Sie die gewichtete Regression.
Diese Art der Regression weist jedem Datenpunkt eine Gewichtung basierend auf der Varianz seines angepassten Werts zu. Dies gibt Datenpunkten mit höheren Varianzen im Wesentlichen kleine Gewichte, wodurch ihre quadratischen Residuen verkleinert werden. Wenn die richtigen Gewichte verwendet werden, kann dies das Problem der Heteroskedastizität beseitigen.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …