Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Der mittlere absolute prozentuale Fehler (MAPE) wird üblicherweise verwendet, um die Vorhersagegenauigkeit von Modellen zu messen. Es wird berechnet als:
MAPE = (1 / n) * Σ (| actual - prediction | / | actual |) * 100
wo:
MAPE wird häufig verwendet, da es leicht zu interpretieren und zu erklären ist. Beispielsweise bedeutet ein MAPE-Wert von 11,5%, dass die durchschnittliche Differenz zwischen dem vorhergesagten Wert und dem tatsächlichen Wert 11,5% beträgt.
Je niedriger der Wert für MAPE ist, desto besser kann ein Modell Werte vorhersagen. Beispielsweise ist ein Modell mit einer MAPE von 5% genauer als ein Modell mit einer MAPE von 10%.
Es gibt keine integrierte Python-Funktion zum Berechnen von MAPE, aber wir können eine einfache Funktion erstellen, um dies zu tun:
import numpy as np
def mape(actual, pred):
actual, pred = np.array(actual), np.array(pred)
return np.mean(np.abs((actual - pred) / actual)) * 100
Mit dieser Funktion können wir dann die MAPE für zwei Arrays berechnen: eines, das die tatsächlichen Datenwerte enthält, und eines, das die vorhergesagten Datenwerte enthält.
actual = [12, 13, 14, 15, 15,22, 27]
pred = [11, 13, 14, 14, 15, 16, 18]
mape(actual, pred)
10.8009
Aus den Ergebnissen können wir ersehen, dass der mittlere absolute prozentuale Fehler für dieses Modell 10.8009% beträgt. Mit anderen Worten beträgt die durchschnittliche Differenz zwischen dem vorhergesagten Wert und dem tatsächlichen Wert 10.8009%.
Obwohl MAPE leicht zu berechnen und zu interpretieren ist, gibt es zwei mögliche Nachteile bei der Verwendung:
1. Da die Formel zur Berechnung des absoluten prozentualen Fehlers | tatsächliche Vorhersage | lautet / | aktuell | Dies bedeutet, dass MAPE undefiniert ist, wenn einer der tatsächlichen Werte Null ist.
2. MAPE sollte nicht mit Daten mit geringem Datenvolumen verwendet werden. Wenn beispielsweise die tatsächliche Nachfrage für einen Artikel 2 und die Prognose 1 beträgt, beträgt der Wert für den absoluten prozentualen Fehler | 2-1 | / | 2 | = 50%, was den Anschein erweckt, dass der Prognosefehler ziemlich hoch ist, obwohl die Prognose nur um eine Einheit abweicht.
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …