So extrahieren Sie das Jahr aus dem Datum in R (mit Beispielen)

Von Fabian
Kategorie: R
Tags: Zeitreihen
Lesezeit: 3 Minuten

Es gibt zwei Möglichkeiten, das Jahr schnell aus einem Datum in R zu extrahieren:

Methode 1: Verwenden Sie format()

df$year <- format(as.Date(df$date, format="%d/%m/%Y"),"%Y")

Methode 2: Verwenden Sie das lubridate-Paket

library(lubridate)

df$year <- year(mdy(df$date))

Dieses Tutorial zeigt ein Beispiel für die praktische Anwendung dieser Methoden.

Methode 1: Jahr aus Datum extrahieren mit format()

Der folgende Code zeigt, wie Sie das Jahr mit der Funktion format() in Kombination mit dem Argument „% Y“ aus einem Datum extrahieren:

#Dataframe erstellen
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#Dataframe anzeigen
df

        date sales
1 01/01/2021    34
2 01/04/2021    36
3 01/09/2021    44

#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- format(as.Date(df$date, format="%d/%m/%Y"),"%Y")

#neues Dataframe anzeigen
df

        date sales year
1 01/01/2021    34 2021
2 01/04/2021    36 2021
3 01/09/2021    44 2021

Beachten Sie, dass diese format()-Funktion mit einer Vielzahl von Datumsformaten funktioniert. Sie müssen lediglich das Format angeben:

#Dataframe erstellen
df <- data.frame(date=c("2021-01-01", "2021-01-04" , "2021-01-09"),
                  sales=c(34, 36, 44))

#Dataframe anzeigen
df

        date sales year
1 2021-01-01    34 2021
2 2021-01-04    36 2021
3 2021-01-09    44 2021

#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- format(as.Date(df$date, format="%Y-%m-%d"),"%Y")

#neues Dataframe anzeigen
df

        date sales year
1 01/01/2021    34 2021
2 01/04/2021    36 2021
3 01/09/2021    44 2021

Methode 2: Extrahieren Sie das Jahr mit lubdridate aus dem Datum

Wir können auch Funktionen aus dem Lubridate-Paket verwenden, um das Jahr schnell aus einem Datum zu extrahieren:

library(lubridate)

#Dataframe erstellen
df <- data.frame(date=c("01/01/2021", "01/04/2021" , "01/09/2021"),
                  sales=c(34, 36, 44))

#Dataframe anzeigen
df

        date sales
1 01/01/2021    34
2 01/04/2021    36
3 01/09/2021    44

#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- year(mdy(df$date))

#neues Dataframe anzeigen
df

        date sales year
1 01/01/2021    34 2021
2 01/04/2021    36 2021
3 01/09/2021    44 2021

Lubridate funktioniert auch mit einer Vielzahl von Datumsformaten. Sie müssen lediglich das Format angeben:

#Dataframe erstellen
df <- data.frame(date=c("2021-01-01", "2021-01-04" , "2021-01-09"),
                  sales=c(34, 36, 44))

#Dataframe anzeigen
df

        date sales year
1 2021-01-01    34 2021
2 2021-01-04    36 2021
3 2021-01-09    44 2021

#Erstellen Sie eine neue Variable, die das Jahr enthält
df$year <- year(ymd(df$date))

#neues Dataframe anzeigen
df

        date sales year
1 01/01/2021    34 2021
2 01/04/2021    36 2021
3 01/09/2021    44 2021

Zusätzliche Ressourcen

So durchlaufen Sie Spaltennamen in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: