Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Oft möchten Sie eine Zeitreihe in R zeichnen, um zu visualisieren, wie sich die Werte der Zeitreihen im Laufe der Zeit ändern.
In diesem Tutorial wird erklärt, wie Sie dies mithilfe der Datenvisualisierungsbibliothek ggplot2 schnell tun [önnen.
Angenommen, wir haben den folgenden Datensatz in R:
#Datensatz erstellen
df <- data.frame(date = as.Date("2021-01-01") - 0:99,
sales = runif(100, 10, 500) + seq(50, 149)^2)
#Die ersten sechs Zeilen anzeigen
head(df)
date sales
1 2021-01-01 2845.506
2 2020-12-31 2837.849
3 2020-12-30 3115.517
4 2020-12-29 2847.161
5 2020-12-28 3374.619
6 2020-12-27 3182.005
Mit dem folgenden Code können wir mit ggplot2 ein grundlegendes Zeitreihendiagramm für diesen Datensatz erstellen:
library(ggplot2)
#Zeitreihendiagramm erstellen
p <- ggplot(df, aes(x=date, y=sales)) +
geom_line()
#Zeitreihenplot anzeigen
p
Wir können die Funktion scale_x_date() * verwenden, um die entlang der x-Achse des Diagramms angezeigten Daten zu formatieren. Diese Funktion akzeptiert die folgenden Argumente:
* Damit diese Funktion funktioniert, muss die x-Achsenvariable eine Datumsvariable sein. Wenn sie noch keine ist, können Sie sie mit as.Date(Variablenname)
schnell in eine konvertieren.
Der folgende Code zeigt, wie eines dieser Formate in der Praxis verwendet wird:
p + scale_x_date(date_labels = "%b %Y")
Sie können auch häufigere (oder seltenere) Unterbrechungen entlang der x-Achse hinzufügen, indem Sie das Argument date_breaks verwenden. Zum Beispiel könnten wir die Daten für alle zwei Wochen entlang der x-Achse anzeigen:
p + scale_x_date(date_breaks = "2 week")
Mit dem folgenden Argument können wir die Beschriftungen der x-Achse auch leicht abwinkeln:
p + theme(axis.text.x=element_text(angle=50, hjust=1))
Zuletzt können wir das Thema, die Achsenbeschriftungen und den Titel ändern, um die Zeitreihendarstellung optisch ansprechender zu gestalten:
p <- ggplot(df, aes(x=date, y=sales)) +
geom_line(color="turquoise4") +
theme_minimal() +
labs(x="", y="Sales", title="Total Sales (Past 100 Days)") +
theme(plot.title = element_text(hjust=0.5, size=20, face="bold"))
p
Eine vollständige Anleitung zu den besten ggplot2-Themen
Erstellen von Side-by-Side-Plots in ggplot2
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …