Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein gewichteter gleitender Durchschnitt ist eine Technik, mit der Zeitreihendaten geglättet werden können, um das „Rauschen“ in den Daten zu reduzieren und Muster und Trends leichter zu identifizieren.
Die ganze Idee hinter einem gewichteten gleitenden Durchschnitt besteht darin, den Durchschnitt einer bestimmten Anzahl vorheriger Perioden zu verwenden, um einen „Durchschnittswert“ für einen bestimmten Zeitraum zu erhalten, während neueren Zeiträumen mehr Gewicht beigemessen wird.
In diesem Tutorial zeigen wir, wie Sie gewichtete gleitende Durchschnitte für Zeitreihendaten in Excel finden.
Angenommen, wir haben den folgenden Datensatz, der die Verkäufe eines bestimmten Unternehmens während 10 Zeiträumen anzeigt:
Wir können die folgenden Schritte ausführen, um gewichtete gleitende Durchschnitte für diesen Zeitraum zu berechnen:
Schritt 1: Entscheiden Sie, wie viele vorherige Perioden in die Berechnung des gewichteten gleitenden Durchschnitts einbezogen werden sollen.
In diesem Beispiel werden drei Punkte verwendet.
Schritt 2: Entscheiden Sie, welche Gewichte jeder Periode zugewiesen werden sollen.
Wir werden die Gewichte wie folgt zuweisen:
Beachten Sie, dass sich die Gesamtgewichte zu 1 addieren müssen.
Schritt 3: Berechnen Sie den gewichteten gleitenden Durchschnitt für jede Periode.
In der Abbildung unten zeigt Spalte C den gewichteten gleitenden Durchschnitt (WMA = weighted moving average) für den Zeitraum 3 und Spalte D die Formel, mit der wir ihn berechnet haben:
Wir können eine ähnliche Formel verwenden, um den gewichteten gleitenden Durchschnitt für jeden Zeitraum zu ermitteln:
Wenn wir ein Liniendiagramm erstellen, um den tatsächlichen Umsatz im Vergleich zum gewichteten gleitenden Durchschnitt zu visualisieren, werden wir feststellen, dass die WMA-Linie glatter ist und weniger Spitzen und Täler aufweist. Dies ist die ganze Idee hinter einem gewogenen gleitenden Durchschnitt – es ermöglicht uns, den wahren zugrunde liegenden Trend der Daten ohne das zusätzliche Rauschen zu sehen.
Sie können zwei Zahlen anpassen, die zu unterschiedlich gewichteten Berechnungen des gleitenden Durchschnitts führen:
Die Anzahl der zuvor verwendeten Perioden. In unserem Beispiel haben wir drei vorherige Perioden verwendet, um die gewichteten gleitenden Durchschnitte zu berechnen. Wir hätten jedoch 4, 5, 6 usw. wählen können. Als Faustregel gilt: Je mehr Perioden Sie in Ihren Berechnungen verwenden, desto glatter wird die gewogene gleitende Durchschnittslinie wird sein.
Die jeder Periode zugewiesenen Gewichte. In unserem Beispiel haben wir die Gewichte als 0,5, 0,3 und 0,2 zugewiesen, aber wir hätten jede beliebige Kombination von Gewichten wählen können, solange sie sich zu 1 addieren. Als Faustregel gilt: Je mehr Gewicht Sie der aktuellsten Periode geben, Je weniger glatt die gewichtete Linie des gleitenden Durchschnitts ist.
Um dies zu veranschaulichen, sollten Sie überlegen, ob wir für unsere WMA-Berechnung erneut drei Perioden verwendet haben, stattdessen jedoch die folgenden Gewichte verwendet haben:
Da wir dem aktuellen Zeitraum so viel Gewicht beigemessen haben, wäre die gewichtete Linie des gleitenden Durchschnitts weniger glatt und ähnelt eher der tatsächlichen Verkaufslinie:
Ein einfacher gleitender Durchschnitt ist eine Möglichkeit, einen gleitenden Durchschnitt zu berechnen, in dem alle in der Berechnung verwendeten Zeiträume das gleiche Gewicht erhalten.
Verwandte Themen: So finden Sie den gleitenden Durchschnitt in Excel
Wenn Sie beispielsweise drei Zeiträume zur Berechnung des gleitenden Durchschnitts verwenden, beträgt das Gewicht für jeden Zeitraum 0,333. Wenn Sie vier Zeiträume zur Berechnung des gleitenden Durchschnitts verwenden, beträgt das Gewicht für jeden Zeitraum 0,25.
Ein einfacher gleitender Durchschnitt ist einfacher zu berechnen, aber der Vorteil der Verwendung eines gewichteten gleitenden Durchschnitts besteht darin, dass Sie neueren Perioden höhere Gewichte zuweisen können. Dies ist nützlich, wenn Ihre Daten in eine bestimmte Richtung tendieren und Sie eine genauere Vorstellung vom Trend erhalten möchten.
Angenommen, Sie berechnen den gewichteten gleitenden Durchschnitt für Punkte, die von einem Basketballspieler erzielt werden, der im Laufe der Saison immer besser wird. Wenn Sie einen gleitenden Durchschnitt von fünf Spielen verwenden, möchten Sie den in ihrem letzten Spiel erzielten Punkten mehr Gewicht beimessen, damit Sie eine genauere Vorstellung davon bekommen, wie viele Punkte sie voraussichtlich erzielen werden.
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …