Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die folgende Syntax verwenden:
#Berechnen Sie den gleitenden Median der letzten 3 Perioden
df['column_name'].rolling(3).median()
Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis verwenden.
Angenommen, wir haben den folgenden Pandas DataFrame:
import pandas as pd
#Dataframe erstellen
df = pd.DataFrame({'month': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
'leads': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24],
'sales': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]})
#Dataframe anzeigen
df
month leads sales
0 1 13 22
1 2 15 24
2 3 16 23
3 4 15 27
4 5 17 26
5 6 20 26
6 7 22 27
7 8 24 30
8 9 25 33
9 10 26 32
10 11 23 27
11 12 24 25
Wir können die folgende Syntax verwenden, um eine neue Spalte zu erstellen, die den gleitenden Median der „Umsätze“ für die vorherigen 3 Perioden enthält:
#Rollierenden 3-Monats-Median berechnen
df['sales_rolling3'] = df['sales'].rolling(3).median()
#Aktualisierten Dataframe anzeigen
df
month leads sales sales_rolling3
0 1 13 22 NaN
1 2 15 24 NaN
2 3 16 23 23.0
3 4 15 27 24.0
4 5 17 26 26.0
5 6 20 26 26.0
6 7 22 27 26.0
7 8 24 30 27.0
8 9 25 33 30.0
9 10 26 32 32.0
10 11 23 27 32.0
11 12 24 25 27.0
Wir können manuell überprüfen, ob der für Monat 3 angezeigte gleitende Median der Verkäufe dem Median der letzten 3 Monate entspricht:
In ähnlicher Weise können wir die gleitenden Medianverkäufe von Monat 4 überprüfen:
Wir können eine ähnliche Syntax verwenden, um den gleitenden 6-Monats-Median zu berechnen:
#Berechnen Sie den rollierenden 6-Monats-Median
df['sales_rolling6'] = df['sales'].rolling(6).median()
#Aktualisierten Dataframe anzeigen
df
month leads sales sales_rolling3 sales_rolling6
0 1 13 22 NaN NaN
1 2 15 24 NaN NaN
2 3 16 23 23.0 NaN
3 4 15 27 24.0 NaN
4 5 17 26 26.0 NaN
5 6 20 26 26.0 25.0
6 7 22 27 26.0 26.0
7 8 24 30 27.0 26.5
8 9 25 33 30.0 27.0
9 10 26 32 32.0 28.5
10 11 23 27 32.0 28.5
11 12 24 25 27.0 28.5
Die folgenden Tutorials erklären, wie Sie andere gängige Operationen in Pandas ausführen:
So berechnen Sie einen gleitenden Mittelwert in Pandas
So berechnen Sie die gleitende Korrelation in Pandas
So berechnen Sie die prozentuale Veränderung bei Pandas
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Eine Zeitreihe wird als „stationär“ bezeichnet, wenn sie keinen Trend aufweist, über die Zeit eine konstante Varianz aufweist und über die Zeit eine konstante Autokorrelationsstruktur aufweist.
Eine Möglichkeit zu testen …