Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Residuenplot werden häufig verwendet, um zu bewerten, ob die Residuen in einer Regressionsanalyse normal verteilt sind oder nicht und ob sie eine Heteroskedastizität aufweisen oder nicht.
In diesem Tutorial wird erläutert, wie Sie Residuenplot für ein Regressionsmodell in R erstellen.
In diesem Beispiel werden wir ein Regressionsmodell unter Verwendung des integrierten R-Datensatzes mtcars anpassen und dann drei verschiedene Residuenplots erstellen, um die Residuen zu analysieren.
Schritt 1: Regressionsmodell anpassen.
Zunächst werden wir ein Regressionsmodell anpassen, das mpg als Antwortvariable und disp und hp als erklärende Variablen verwendet:
#Laden Sie den Datensatz
data(mtcars)
#ein Regressionsmodell anpassen
model <- lm(mpg~disp+hp, data=mtcars)
#Liste der Residuen abrufen
res <- resid(model)
Schritt 2: Erstellen Sie ein Residuenplot vs angepassten Plot.
Als nächstes erstellen wir ein Residuum-Fit-Diagramm, das für die visuelle Erkennung der Heteroskedastizität hilfreich ist - z. B. eine systematische Änderung der Verteilung der Residuen über einen Wertebereich.
#Residuen vs Fitted-Plot
plot(fitted(model), res)
#Eine horizontale Linie bei 0 hinzufügen
abline(0,0)
Die x-Achse zeigt die angepassten Werte an und die y-Achse zeigt die Residuen an. Aus dem Diagramm können wir ersehen, dass die Streuung der Residuen für höhere angepasste Werte tendenziell höher ist, aber es sieht nicht ernst genug aus, dass wir Änderungen am Modell vornehmen müssten.
Schritt 3: Erstellen Sie ein QQ-Diagramm.
Wir können auch ein Q-Q-Diagramm erstellen, das nützlich ist, um festzustellen, ob die Residuen einer Normalverteilung folgen. Wenn die Datenwerte im Diagramm entlang einer ungefähr geraden Linie in einem Winkel von 45 Grad fallen, werden die Daten normal verteilt.
#QQ-Plot für Residuen erstellen
qqnorm(res)
#Fügen Sie dem Plot eine gerade diagonale Linie hinzu
qqline(res)
Wir können sehen, dass die Residuen dazu neigen, ziemlich weit von der Linie in der Nähe der Schwänze abzuweichen, was darauf hinweisen könnte, dass sie nicht normal verteilt sind.
Schritt 4: Erstellen Sie ein Dichtediagramm.
Wir können auch ein Dichtediagramm erstellen, das auch nützlich ist, um visuell zu überprüfen, ob die Residuen normal verteilt sind oder nicht. Wenn das Diagramm ungefähr glockenförmig ist, folgen die Residuen wahrscheinlich einer Normalverteilung.
#Dichtediagramm der Residuen erstellen
plot(density(res))
Wir können sehen, dass das Dichtediagramm ungefähr einer Glockenform folgt, obwohl es leicht nach rechts geneigt ist. Abhängig von der Art der Studie kann ein Forscher entscheiden, eine Transformation der Daten durchzuführen oder nicht, um sicherzustellen, dass die Residuen "normaler" verteilt sind.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …