Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Die mittlere absolute Abweichung misst die Streuung der Beobachtungen in einem Datensatz.
Dies ist eine besonders nützliche Metrik, da sie weniger von Ausreißern betroffen ist als andere Streuungsmaße wie Standardabweichung und Varianz.
Die Formel zur Berechnung der absoluten Medianabweichung, häufig als MAD abgekürzt, lautet wie folgt:
MAD = Median (| x i - x m |)
wo:
Das folgende Beispiel zeigt, wie die mittlere absolute Abweichung in R mithilfe der integrierten Funktion mad() berechnet wird.
Der folgende Code zeigt, wie die mittlere absolute Abweichung für einen einzelnen Vektor in R berechnet wird:
# Daten definieren
data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24)
# MAD berechnen
mad(data)
[1] 11.1195
Die mittlere absolute Abweichung für den Datensatz beträgt 11,1195.
Der folgende Code zeigt, wie MAD für eine einzelne Spalte in einem Dataframe berechnet wird:
# Daten definieren
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
y = c(3, 4, 6, 8, 8, 9, 19),
z = c(2, 2, 2, 3, 5, 8, 11))
#MAD für Spalte y im Dataframe berechnen
mad(data$y)
[1] 2.9652
Die mittlere absolute Abweichung für Spalte y beträgt 2,9652.
Der folgende Code zeigt, wie MAD für mehrere Spalten in einem Dataframe mithilfe der Funktion sapply() berechnet wird:
#Daten definieren
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
y = c(3, 4, 6, 8, 8, 9, 19),
z = c(2, 2, 2, 3, 5, 8, 11))
# MAD für alle Spalten im Dataframe berechnen
sapply(data, mad)
x y z
2.9652 2.9652 1.4826
Die mittlere absolute Abweichung beträgt 2,9652 für Spalte x, 2,9652 für Spalte y und 1,4826 für Spalte z.
Verwandt: Eine Anleitung für apply(), lapply(), sapply() und tapply() in R
So berechnen Sie MAPE in R
Wie berechnet man MSE in R
So berechnen Sie RMSE in R
Das Resampling von Zeitreihendaten bedeutet, die Daten für einen neuen Zeitraum zusammenzufassen oder zu aggregieren.
Wir können die folgende grundlegende Syntax verwenden, um Zeitreihendaten in Python neu abzutasten:
#Finde die …
Ein rollierender Median ist der Median einer bestimmten Anzahl früherer Perioden in einer Zeitreihe.
Um den gleitenden Median für eine Spalte in einem Pandas DataFrame zu berechnen, können wir die …