Wie man einen Breusch-Pagan-Test in R durchführt

Ein Breusch-Pagan-Test wird verwendet, um festzustellen, ob in einer Regressionsanalyse Heteroskedastizität vorliegt.

In diesem Tutorial wird erklärt, wie ein Breusch-Pagan-Test in R durchgeführt wird.

Beispiel: Breusch-Pagan-Test in R

In diesem Beispiel passen wir ein Regressionsmodell unter Verwendung des integrierten R-Datensatzes mtcars an und führen dann einen Breusch-Pagan-Test unter Verwendung der bptest-Funktion aus der lmtest-Bibliothek durch, um festzustellen, ob Heteroskedastizität vorliegt.

Schritt 1: Passen Sie ein Regressionsmodell an.

Zunächst werden wir ein Regressionsmodell anpassen, das mpg als Antwortvariable und disp und hp als die beiden erklärenden Variablen verwendet.

#Laden Sie den Datensatz
data(mtcars)

#Regressionsmodell anpassen
model <- lm(mpg~disp+hp, data=mtcars)

#Modellzusammenfassung anzeigen
summary(model)

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904   1.331566  23.083  < 2e-16 ***
disp        -0.030346   0.007405  -4.098 0.000306 ***
hp          -0.024840   0.013385  -1.856 0.073679.  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared:  0.7482,    Adjusted R-squared:  0.7309 
F-statistic: 43.09 on 2 and 29 DF,  p-value: 2.062e-09

Schritt 2: Führen Sie einen Breusch-Pagan-Test durch.

Als nächstes werden wir einen Breusch-Pagan-Test durchführen, um festzustellen, ob Heteroskedastizität vorliegt.

#lmtest Bibliothek laden
library(lmtest)

#Breusch-Pagan Test durchführen
bptest(model)

    studentized Breusch-Pagan test

data:  model
BP = 4.0861, df = 2, p-value = 0.1296

Die Teststatistik ist 4.0861 und der entsprechende p-Wert ist 0.1296. Da der p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Wir haben nicht genügend Beweise, um zu sagen, dass das Regressionsmodell Heteroskedastizität aufweist.

Was macht man als nächstes

Wenn Sie die Nullhypothese des Breusch-Pagan-Tests nicht ablehnen, liegt keine Heteroskedastizität vor, und Sie können mit der Interpretation der Ausgabe der ursprünglichen Regression fortfahren.

Wenn Sie jedoch die Nullhypothese ablehnen, bedeutet dies, dass die Daten heteroskedastisch sind. In diesem Fall können die Standardfehler, die in der Ausgabetabelle der Regression angezeigt werden, unzuverlässig sein.

Es gibt einige gängige Möglichkeiten, um dieses Problem zu beheben, darunter:

1. Transformieren Sie die Antwortvariable.
Sie können versuchen, eine Transformation für die Antwortvariable durchzuführen. Beispielsweise könnten Sie log (Preis) anstelle von Preis als Antwortvariable verwenden. In der Regel ist das Protokoll der Antwortvariablen ein wirksames Mittel, um die Heteroskedastizität zu beseitigen. Eine andere übliche Transformation besteht darin, die Quadratwurzel der Antwortvariablen zu verwenden.

2. Verwenden Sie die gewichtete Regression.
Diese Art der Regression weist jedem Datenpunkt eine Gewichtung basierend auf der Varianz seines angepassten Werts zu. Dies gibt Datenpunkten mit höheren Varianzen im Wesentlichen kleine Gewichte, wodurch ihre quadratischen Residuen verkleinert werden. Wenn die richtigen Gewichte verwendet werden, kann dies das Problem der Heteroskedastizität beseitigen.

Beispiel: Breusch-Pagan-Test in R

Was macht man als nächstes

Statistik: Der Weg zur Datenanalyse

So berechnen Sie AIC von Regressionsmodellen in Python

So berechnen Sie die AUC (Fläche unter der Kurve) in Python