Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Der Root Mean Square Error (RMSE) ist eine Metrik, die angibt, wie weit unsere vorhergesagten Werte von unseren beobachteten Werten in einem Modell im Durchschnitt entfernt sind. Es wird berechnet als:
RMSE = √ [Σ (P i - O i ) 2 / n]
wo:
In diesem Tutorial wird eine einfache Methode zur Berechnung von RMSE in Python erläutert.
Angenommen, wir haben die folgenden Anordnungen von tatsächlichen und vorhergesagten Werten:
actual= [34, 37, 44, 47, 48, 48, 46, 43, 32, 27, 26, 24]
pred = [37, 40, 46, 44, 46, 50, 45, 44, 34, 30, 22, 23]
Um den RMSE zwischen dem tatsächlichen und dem vorhergesagten Wert zu berechnen, können wir einfach die Quadratwurzel der Funktion mean_squared_error() aus der Bibliothek sklearn.metrics entnehmen:
# Notwendige Bibliotheken importieren
from sklearn.metrics import mean_squared_error
from math import sqrt
# RMSE berechnen
sqrt(mean_squared_error(actual, pred))
2.4324199198
Der RMSE beträgt 2,4324.
RMSE ist eine nützliche Methode, um festzustellen, wie gut ein Modell in einen Datensatz passt. Je größer der RMSE ist, desto größer ist die Differenz zwischen den vorhergesagten und den beobachteten Werten, was bedeutet, dass ein Modell umso schlechter zu den Daten passt. Umgekehrt ist ein Modell umso besser in der Lage, die Daten anzupassen, je kleiner der RMSE ist.
Es kann besonders nützlich sein, den RMSE zweier verschiedener Modelle miteinander zu vergleichen, um festzustellen, welches Modell besser zu den Daten passt.
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …