Wie berechnet man MSE in R

Von Fabian
Kategorie: R
Tags: Zeitreihen
Lesezeit: 2 Minuten

Eine der am häufigsten verwendeten Metriken zur Messung der Vorhersagegenauigkeit eines Modells ist MSE, was für Mean Squared Error steht. Es wird berechnet als:

MSE = (1 / n) * Σ (Ist – Vorhersage) 2

wobei:

  • Σ – ein ausgefallenes Symbol, das „Summe“ bedeutet
  • n – Stichprobengröße
  • Ist – der tatsächliche Datenwert
  • Vorhersage – der vorhergesagte Datenwert

Je niedriger der Wert für MSE ist, desto genauer kann ein Modell Werte vorhersagen.

Wie berechnet man MSE in R

Abhängig davon, in welchem Format Ihre Daten vorliegen, gibt es zwei einfache Methoden, mit denen Sie der MSE eines Regressionsmodells in R berechnen können.

Methode 1: MSE aus dem Regressionsmodell berechnen

In einem Szenario haben Sie möglicherweise ein angepasstes Regressionsmodell und möchten einfach der MSE des Modells berechnen. Beispielsweise haben Sie möglicherweise das folgende Regressionsmodell:

#mtcars-Dataset laden
data(mtcars)

#Regressionsmodell anpassen
model <- lm(mpg~disp+hp, data=mtcars)
#Modellzusammenfassung anzeigen
model_summ <-summary(model)

Um den MSE für dieses Modell zu berechnen, können Sie die folgende Formel verwenden:

#MSE berechnen
mean(model_summ$residuals^2)
[1] 8.85917

Dies sagt uns, dass der MSE 8.85917 ist.

Methode 2: Berechnen Sie der MSE aus einer Liste vorhergesagter und tatsächlicher Werte

In einem anderen Szenario haben Sie möglicherweise einfach eine Liste mit vorhergesagten und tatsächlichen Werten. Beispielsweise:

#Erstellen Sie ein Dataframe mit einer Spalte mit tatsächlichen Werten und einer Spalte mit vorhergesagten Werten
data <- data.frame(pred = predict(model), actual = mtcars$mpg)
#Die ersten sechs Datenzeilen anzeigen
head(data)

                      pred actual
Mazda RX4         23.14809   21.0
Mazda RX4 Wag     23.14809   21.0
Datsun 710        25.14838   22.8
Hornet 4 Drive    20.17416   21.4
Hornet Sportabout 15.46423   18.7
Valiant           21.29978   18.1

In diesem Fall können Sie die folgende Formel zur Berechnung der MSE verwenden:

#MSE berechnen
mean((data$actual - data$pred)^2)
[1] 8.85917

Dies sagt uns, dass der MSE 8.85917 ist, was der MSE entspricht, die wir mit der vorherigen Methode berechnet haben.

Verwandt So berechnen Sie RMSE in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: