So berechnen Sie RMSE in Python

Von Fabian
Kategorie: Python
Tags: Zeitreihen
Lesezeit: 2 Minuten

Der Root Mean Square Error (RMSE) ist eine Metrik, die angibt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einem Modell im Durchschnitt entfernt sind. Es wird berechnet als:

RMSE = √ [Σ (P i - O i ) 2 / n]

wo:

  • Σ ist ein ausgefallenes Symbol, das "Summe" bedeutet.
  • P i ist der vorhergesagte Wert für die i-te Beobachtung
  • O i ist der beobachtete Wert für die i-te Beobachtung
  • n ist die Stichprobengröße

In diesem Tutorial wird eine einfache Methode zur Berechnung von RMSE in Python erläutert.

Beispiel: Berechnen Sie RMSE in Python

Angenommen, wir haben die folgenden Anordnungen von tatsächlichen und vorhergesagten Werten:

actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]

Um den RMSE zwischen dem tatsächlichen und dem vorhergesagten Wert zu berechnen, können wir einfach die Quadratwurzel der Funktion mean_squared_error() aus der Bibliothek sklearn.metrics entnehmen:

# Notwendige Bibliotheken importieren
from sklearn.metrics import mean_squared_error
from math import sqrt

# RMSE berechnen
sqrt(mean_squared_error(actual, pred)) 

2.4324199198

Der RMSE beträgt 2,4324.

Interpretieren von RMSE

RMSE ist eine nützliche Methode, um festzustellen, wie gut ein Modell in einen Datensatz passt. Je größer der RMSE ist, desto größer ist die Differenz zwischen den vorhergesagten und den beobachteten Werten, was bedeutet, dass ein Modell umso schlechter zu den Daten passt. Umgekehrt ist ein Modell umso besser in der Lage, die Daten anzupassen, je kleiner der RMSE ist.

Es kann besonders nützlich sein, den RMSE zweier verschiedener Modelle miteinander zu vergleichen, um festzustellen, welches Modell besser zu den Daten passt.

Zusätzliche Ressourcen

MSE-Rechner
So berechnen Sie MAPE in Python

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: