Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Eine der am häufigsten verwendeten Metriken zur Messung der Prognosegenauigkeit eines Modells ist MAPE, was für den mittleren absoluten prozentualen Fehler (Mean Absolute Percentage Error) steht.
Die Formel zur Berechnung der MAPE lautet wie folgt:
MAPE = (1/n) * Σ(|actual – forecast| / |actual|) * 100
wo:
MAPE wird häufig verwendet, da es leicht zu interpretieren und zu erklären ist. Ein MAPE-Wert von 11,5% bedeutet beispielsweise, dass die durchschnittliche Differenz zwischen dem prognostizierten Wert und dem tatsächlichen Wert 11,5% beträgt.
Je niedriger der Wert für MAPE ist, desto besser kann ein Modell Werte vorhersagen. Beispielsweise ist ein Modell mit einer MAPE von 2% genauer als ein Modell mit einer MAPE von 10%.
Um MAPE in Excel zu berechnen, können Sie die folgenden Schritte ausführen:
Schritt 1: Geben Sie die tatsächlichen und prognostizierten Werte in zwei separaten Spalten ein.
Schritt 2: Berechnen Sie den absoluten prozentualen Fehler für jede Zeile.
Denken Sie daran, dass der absolute prozentuale Fehler wie folgt berechnet wird: | Ist-Prognose | / | aktuell | * 100. Mit dieser Formel berechnen wir den absoluten prozentualen Fehler für jede Zeile.
Spalte D zeigt den absoluten prozentualen Fehler an und Spalte E zeigt die von uns verwendete Formel:
Wir werden diese Formel für jede Zeile wiederholen:
Schritt 3: Berechnen Sie den mittleren absoluten prozentualen Fehler.
Berechnen Sie die MAPE, indem Sie einfach den Durchschnitt der Werte in Spalte D ermitteln:
=MITTELWERT(D2:D13)
Die MAPE dieses Modells beträgt 6,47%.
Obwohl MAPE einfach zu berechnen und leicht zu interpretieren ist, gibt es einige mögliche Nachteile bei der Verwendung:
Eine andere übliche Methode zur Messung der Prognosegenauigkeit eines Modells ist die mittlere absolute Abweichung (MAD – Mean Absolute Deviation). Lesen Sie hier, wie Sie MAD in Excel berechnen.
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …