Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Es gibt zwei Möglichkeiten, das Jahr schnell aus einem Datum in R zu extrahieren:
Methode 1: Verwenden Sie format()
df$year <- format(as.Date(df$date, format="%d/%m/%Y"),"%Y")
Methode 2: Verwenden Sie das lubridate-Paket
library(lubridate)
df$year <- year(mdy(df$date))
Dieses Tutorial zeigt ein Beispiel für die praktische Anwendung dieser Methoden.
Der folgende Code zeigt, wie Sie das Jahr mit der Funktion format() in Kombination mit dem Argument „% Y“ aus einem Datum extrahieren:
#Dataframe erstellen
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
sales=c(34, 36, 44))
#Dataframe anzeigen
df
date sales
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44
#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- format(as.Date(df$date, format="%d/%m/%Y"),"%Y")
#neues Dataframe anzeigen
df
date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021
Beachten Sie, dass diese format()-Funktion mit einer Vielzahl von Datumsformaten funktioniert. Sie müssen lediglich das Format angeben:
#Dataframe erstellen
df <- data.frame(date=c("2021-01-01", "2021-01-04" , "2021-01-09"),
sales=c(34, 36, 44))
#Dataframe anzeigen
df
date sales year
1 2021-01-01 34 2021
2 2021-01-04 36 2021
3 2021-01-09 44 2021
#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- format(as.Date(df$date, format="%Y-%m-%d"),"%Y")
#neues Dataframe anzeigen
df
date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021
Wir können auch Funktionen aus dem Lubridate-Paket verwenden, um das Jahr schnell aus einem Datum zu extrahieren:
library(lubridate)
#Dataframe erstellen
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
sales=c(34, 36, 44))
#Dataframe anzeigen
df
date sales
1 01/01/2021 34
2 01/04/2021 36
3 01/09/2021 44
#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- year(mdy(df$date))
#neues Dataframe anzeigen
df
date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021
Lubridate funktioniert auch mit einer Vielzahl von Datumsformaten. Sie müssen lediglich das Format angeben:
#Dataframe erstellen
df <- data.frame(date=c("2021-01-01", "2021-01-04" , "2021-01-09"),
sales=c(34, 36, 44))
#Dataframe anzeigen
df
date sales year
1 2021-01-01 34 2021
2 2021-01-04 36 2021
3 2021-01-09 44 2021
#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- year(ymd(df$date))
#neues Dataframe anzeigen
df
date sales year
1 01/01/2021 34 2021
2 01/04/2021 36 2021
3 01/09/2021 44 2021
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …