Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Der mittlere quadratische Fehler (engl. Mean Squared Error - MSE) ist eine übliche Methode zur Messung der Vorhersagegenauigkeit eines Modells. Es wird berechnet als:
MSE = (1 / n) * Σ (actual - prediction) 2
wo:
Je niedriger der Wert für MSE ist, desto besser kann ein Modell Werte genau vorhersagen.
Wir können eine einfache Funktion zur Berechnung der MSE in Python erstellen:
import numpy as np
def mse(actual, pred):
actual, pred = np.array(actual), np.array(pred)
return np.square(np.subtract(actual,pred)).mean()
Mit dieser Funktion können wir dann die MSE für zwei Arrays berechnen: eines, das die tatsächlichen Datenwerte enthält, und eines, das die vorhergesagten Datenwerte enthält.
actual = [12, 13, 14, 15, 15, 22, 27]
pred = [11, 13, 14, 14, 15, 16, 18]
mse(actual, pred)
17.0
Der mittlere quadratische Fehler (MSE) für dieses Modell beträgt 17,0.
In der Praxis wird der Root Mean Squared Error (RMSE) häufiger zur Beurteilung der Modellgenauigkeit verwendet. Wie der Name schon sagt, ist es einfach die Quadratwurzel des mittleren quadratischen Fehlers.
Wir können eine ähnliche Funktion zur Berechnung des RMSE definieren:
import numpy as np
def rmse(actual, pred):
actual, pred = np.array(actual), np.array(pred)
return np.sqrt(np.square(np.subtract(actual,pred)).mean())
Mit dieser Funktion können wir dann den RMSE für zwei Arrays berechnen: eines, das die tatsächlichen Datenwerte enthält, und eines, das die vorhergesagten Datenwerte enthält.
actual = [12, 13, 14, 15, 15, 22, 27]
pred = [11, 13, 14, 14, 15, 16, 18]
rmse(actual, pred)
4.1231
Der quadratische Mittelwertfehler (RMSE) für dieses Modell beträgt 4,1231.
MSE-Rechner (Mean Squared Error)
So berechnen Sie den mittleren quadratischen Fehler (MSE) in Excel
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …