Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.

Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die folgende Syntax verwenden:

#Berechnen Sie den gleitenden Median der letzten 3 Perioden
df['column_name'].rolling(3).median()

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis verwenden.

Beispiel: Berechnen Sie den gleitenden Median der Spalte

Angenommen, wir haben den folgenden Pandas DataFrame:

import pandas as pd

#Dataframe erstellen
df = pd.DataFrame({'month': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
                   'leads': [13, 15, 16, 15, 17, 20, 22, 24, 25, 26, 23, 24],
                   'sales': [22, 24, 23, 27, 26, 26, 27, 30, 33, 32, 27, 25]})

#Dataframe anzeigen
df

    month   leads   sales
0   1   13  22
1   2   15  24
2   3   16  23
3   4   15  27
4   5   17  26
5   6   20  26
6   7   22  27
7   8   24  30
8   9   25  33
9   10  26  32
10  11  23  27
11  12  24  25

Wir können die folgende Syntax verwenden, um eine neue Spalte zu erstellen, die den gleitenden Median der „Umsätze“ für die vorherigen 3 Perioden enthält:

#Rollierenden 3-Monats-Median berechnen
df['sales_rolling3'] = df['sales'].rolling(3).median()

#Aktualisierten Dataframe anzeigen
df

    month   leads   sales   sales_rolling3
0   1   13  22  NaN
1   2   15  24  NaN
2   3   16  23  23.0
3   4   15  27  24.0
4   5   17  26  26.0
5   6   20  26  26.0
6   7   22  27  26.0
7   8   24  30  27.0
8   9   25  33  30.0
9   10  26  32  32.0
10  11  23  27  32.0
11  12  24  25  27.0

Wir können manuell überprüfen, ob der für Monat 3 angezeigte gleitende Median der Verkäufe dem Median der letzten 3 Monate entspricht:

  • Median von 22, 24, 23 = 23,0

In ähnlicher Weise können wir die gleitenden Medianverkäufe von Monat 4 überprüfen:

  • Median von 24, 23, 27 = 24,0

Wir können eine ähnliche Syntax verwenden, um den gleitenden 6-Monats-Median zu berechnen:

#Berechnen Sie den rollierenden 6-Monats-Median
df['sales_rolling6'] = df['sales'].rolling(6).median() 

#Aktualisierten Dataframe anzeigen
df

month   leads   sales   sales_rolling3  sales_rolling6
0   1   13  22  NaN NaN
1   2   15  24  NaN NaN
2   3   16  23  23.0    NaN
3   4   15  27  24.0    NaN
4   5   17  26  26.0    NaN
5   6   20  26  26.0    25.0
6   7   22  27  26.0    26.0
7   8   24  30  27.0    26.5
8   9   25  33  30.0    27.0
9   10  26  32  32.0    28.5
10  11  23  27  32.0    28.5
11  12  24  25  27.0    28.5

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere gängige Operationen in Pandas ausführen:

So berechnen Sie einen gleitenden Mittelwert in Pandas
So berechnen Sie die gleitende Korrelation in Pandas
So berechnen Sie die prozentuale Veränderung bei Pandas

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: