Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Der einfachste Weg, ein Dataframe um einen Datumsbereich in R zu unterteilen, ist die Verwendung der folgenden Syntax:
df[df$date >= "some date" & df$date <= "some date", ]
Dieses Tutorial enthält einige Beispiele für die praktische Verwendung dieser Funktion.
Der folgende Code zeigt, wie Sie die Zeilen eines Dataframes auswählen, die zwischen zwei Daten liegen, einschließlich:
#Machen Sie dieses Beispiel reproduzierbar
set.seed(0)
#Dataframe erstellen
df <- data.frame(date = as.Date("2021-01-01") - 0:19,
sales = runif(20, 10, 500) + seq(50, 69)^2)
#Die ersten sechs Zeilen anzeigen
head(df)
date sales
1 2021-01-01 2949.382
2 2020-12-31 2741.099
3 2020-12-30 2896.341
4 2020-12-29 3099.698
5 2020-12-28 3371.022
6 2020-12-27 3133.824
#subset zwischen zwei Daten, einschließlich
df[df$date >= "2020-12-25" & df$date <= "2020-12-28", ]
date sales
5 2020-12-28 3371.022
6 2020-12-27 3133.824
7 2020-12-26 3586.211
8 2020-12-25 3721.891
Sie müssen nur die Größer- und Kleiner-Zeichen ändern, um die Zeilen auszuwählen, die zwischen zwei Daten liegen, ausschließlich:
#Machen Sie dieses Beispiel reproduzierbar
set.seed(0)
# Dataframe erstellen
df <- data.frame(date = as.Date("2021-01-01") - 0:19,
sales = runif(20, 10, 500) + seq(50, 69)^2)
#subset zwischen zwei Daten, exklusiv
df[df$date > "2020-12-25" & df$date < "2020-12-28", ]
date sales
6 2020-12-27 3133.824
7 2020-12-26 3586.211
Der folgende Code zeigt, wie Sie die Zeilen eines Dataframes auswählen, die nach einem bestimmten Datum auftreten:
#Machen Sie dieses Beispiel reproduzierbar
set.seed(0)
# Dataframe erstellen
df <- data.frame(date = as.Date("2021-01-01") - 0:19,
sales = runif(20, 10, 500) + seq(50, 69)^2)
#subset nach einem bestimmten Datum
df[df$date >= "2020-12-22", ]
date sales
1 2021-01-01 2949.382
2 2020-12-31 2741.099
3 2020-12-30 2896.341
4 2020-12-29 3099.698
5 2020-12-28 3371.022
6 2020-12-27 3133.824
7 2020-12-26 3586.211
8 2020-12-25 3721.891
9 2020-12-24 3697.791
10 2020-12-23 3799.266
11 2020-12-22 3640.275
Der folgende Code zeigt, wie Sie die Zeilen eines Dataframes auswählen, die vor einem bestimmten Datum auftreten:
#Machen Sie dieses Beispiel reproduzierbar
set.seed(0)
#Dataframe erstellen
df <- data.frame(date = as.Date("2021-01-01") - 0:19,
sales = runif(20, 10, 500) + seq(50, 69)^2)
#Subset vor einem bestimmten Datum
df[df$date < "2020-12-22", ]
date sales
12 2020-12-21 3831.928
13 2020-12-20 3940.513
14 2020-12-19 4315.641
15 2020-12-18 4294.211
16 2020-12-17 4612.222
17 2020-12-16 4609.873
18 2020-12-15 4850.633
19 2020-12-14 5120.034
20 2020-12-13 4957.217
So zeichnen Sie eine Zeitreihe in R
So extrahieren Sie das Jahr vom Datum in R
So aggregieren Sie tägliche Daten zu monatlichen und jährlichen Daten in R
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …