Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Eine der am häufigsten verwendeten Metriken zur Messung der Prognosegenauigkeit eines Modells ist MSE, was für Mean Squared Error steht. Es wird berechnet als:
MSE = (1 / n) * Σ (Ist – Prognose) 2
wo:
Je niedriger der Wert für MSE ist, desto besser kann ein Modell Werte genau vorhersagen.
Um MSE in Excel zu berechnen, können Sie die folgenden Schritte ausführen:
Schritt 1: Geben Sie die tatsächlichen und prognostizierten Werte in zwei separaten Spalten ein.
Schritt 2: Berechnen Sie den quadratischen Fehler für jede Zeile.
Denken Sie daran, dass der quadratische Fehler wie folgt berechnet wird: (Ist – Prognose)2 . Wir werden diese Formel verwenden, um den quadratischen Fehler für jede Zeile zu berechnen.
Spalte D zeigt den quadratischen Fehler an und Spalte E zeigt die Formel, die wir verwendet haben:
Wiederholen Sie diese Formel für jede Zeile:
Schritt 3: Berechnen Sie den mittleren quadratischen Fehler.
Berechnen Sie der MSE, indem Sie einfach den Durchschnitt der Werte in Spalte D ermitteln:
(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)
=MITTELWERT(D2:D13)
der MSE dieses Modells beträgt 5,917.
Zwei weitere gängige Metriken zur Bewertung der Modellgenauigkeit sind MAD (mittlere absolute Abweichung) und MAPE (mittlerer absoluter prozentualer Fehler). In den folgenden Tutorials wird erläutert, wie diese Metriken in Excel berechnet werden:
So berechnen Sie die mittlere absolute Abweichung (MAD) in Excel
So berechnen Sie den mittleren absoluten prozentualen Fehler (MAPE) in Excel
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …