Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Der mittlere quadratische Fehler (engl. Mean Squared Error = MSE) ist eine übliche Methode zur Messung der Vorhersagegenauigkeit eines Modells. Es wird berechnet als:
MSE = (1 / n) * Σ (Ist – Vorhersage) 2
wobei:
Je niedriger der Wert für MSE ist, desto besser kann ein Modell Werte genau vorhersagen.
Wir können eine einfache Funktion zur Berechnung der MSE in Python erstellen:
import numpy as np
def mse (aktuell, pred):
actual, pred = np.array(actual), np.array(pred)
return np.square(np.subtract(actual, pred)).mean()
Mit dieser Funktion können wir dann der MSE für zwei Arrays berechnen: eines, das die tatsächlichen Datenwerte enthält, und eines, das die vorhergesagten Datenwerte enthält.
actual = [12, 13, 14, 15, 15, 22, 27]
pred = [11, 13, 14, 14, 15, 16, 18]
mse(actual, pred)
17.0
Der mittlere quadratische Fehler (MSE) für dieses Modell beträgt 17,0.
In der Praxis wird der quadratische Mittelwertfehler (engl. Root Mean Squared Error = RMSE) häufiger zur Beurteilung der Modellgenauigkeit verwendet. Wie der Name schon sagt, ist es einfach die Quadratwurzel des mittleren quadratischen Fehlers.
Wir können eine ähnliche Funktion zur Berechnung des RMSE definieren:
import numpy as np
def rmse (aktuell, pred):
actual, pred = np.array(actual), np.array(pred)
return np.sqrt(np.square(np.subtract(actual, pred)).mean())
Mit dieser Funktion können wir dann den RMSE für zwei Arrays berechnen: eines, das die tatsächlichen Datenwerte enthält, und eines, das die vorhergesagten Datenwerte enthält.
actual = [12, 13, 14, 15, 15, 22, 27]
pred = [11, 13, 14, 14, 15, 16, 18]
rmse(actual, pred)
4.1231
Der quadratische Mittelwertfehler (RMSE) für dieses Modell beträgt 4,1231.
Verwandte Artikel:
So berechnen Sie MAPE in Python
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …