Berechnung der mittleren absoluten Abweichung in R

Von Fabian
Kategorie: R
Tags: Zeitreihen
Lesezeit: 2 Minuten

Die mittlere absolute Abweichung misst die Streuung der Beobachtungen in einem Datensatz.

Dies ist eine besonders nützliche Metrik, da sie weniger von Ausreißern betroffen ist als andere Streuungsmaße wie Standardabweichung und Varianz.

Die Formel zur Berechnung der absoluten Medianabweichung, häufig als MAD abgekürzt, lautet wie folgt:

MAD = Median (| x i - x m |)

wo:

  • x i: Der i-te Wert im Datensatz
  • x m: Der Medianwert im Datensatz

Das folgende Beispiel zeigt, wie die mittlere absolute Abweichung in R mithilfe der integrierten Funktion mad() berechnet wird.

Beispiel 1: Berechnen Sie MAD für einen Vektor

Der folgende Code zeigt, wie die mittlere absolute Abweichung für einen einzelnen Vektor in R berechnet wird:

# Daten definieren
data <- c(1, 4, 4, 7, 12, 13, 16, 19, 22, 24)

# MAD berechnen
mad(data)

[1] 11.1195

Die mittlere absolute Abweichung für den Datensatz beträgt 11,1195.

Beispiel 2: Berechnen Sie MAD für eine Spalte in einem Dataframe

Der folgende Code zeigt, wie MAD für eine einzelne Spalte in einem Dataframe berechnet wird:

# Daten definieren
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
                   y = c(3, 4, 6, 8, 8, 9, 19),
                   z = c(2, 2, 2, 3, 5, 8, 11))

#MAD für Spalte y im Dataframe berechnen
mad(data$y)

[1] 2.9652

Die mittlere absolute Abweichung für Spalte y beträgt 2,9652.

Beispiel 3: Berechnen Sie MAD für mehrere Spalten in einem Dataframe

Der folgende Code zeigt, wie MAD für mehrere Spalten in einem Dataframe mithilfe der Funktion sapply() berechnet wird:

#Daten definieren
data <- data.frame(x = c(1, 4, 4, 6, 7, 8, 12),
                   y = c(3, 4, 6, 8, 8, 9, 19),
                   z = c(2, 2, 2, 3, 5, 8, 11))

# MAD für alle Spalten im Dataframe berechnen
sapply(data, mad)

     x      y      z 
2.9652 2.9652 1.4826

Die mittlere absolute Abweichung beträgt 2,9652 für Spalte x, 2,9652 für Spalte y und 1,4826 für Spalte z.

Verwandt: Eine Anleitung für apply(), lapply(), sapply() und tapply() in R

Zusätzliche Ressourcen

So berechnen Sie MAPE in R
Wie berechnet man MSE in R
So berechnen Sie RMSE in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: