Variationskoeffizient in R berechnen - so geht's

Von Fabian
Kategorie: R
Lesezeit: 3 Minuten

Ein Variationskoeffizient, oft als CV abgekürzt, ist eine Möglichkeit zu messen, wie verteilt Werte in einem Datensatz relativ zum Mittelwert sind. Es wird berechnet als:

CV = σ / μ

wo:

  • σ: Die Standardabweichung des Datensatzes
  • μ: Der Mittelwert des Datensatzes

Im Klartext ist der Variationskoeffizient einfach das Verhältnis zwischen der Standardabweichung und dem Mittelwert.

Wann ist der Variationskoeffizient zu verwenden?

Der Variationskoeffizient wird häufig verwendet, um die Variation zwischen zwei verschiedenen Datensätzen zu vergleichen.

In der realen Welt wird es häufig im Finanzbereich verwendet, um die durchschnittliche erwartete Rendite einer Investition mit der erwarteten Standardabweichung der Investition zu vergleichen. Dies ermöglicht es den Anlegern, den Risiko-Rendite-Kompromiss zwischen Anlagen zu vergleichen.

Angenommen, ein Anleger erwägt, in die folgenden zwei Investmentfonds zu investieren:

Investmentfonds A: Mittelwert = 9%, Standardabweichung = 12,4%

Investmentfonds B: Mittelwert = 5%, Standardabweichung = 8,2%

Bei der Berechnung des Variationskoeffizienten für jeden Fonds stellt der Anleger fest:

Lebenslauf für Investmentfonds A = 12,4% / 9% = 1,38

Lebenslauf für Investmentfonds B = 8,2% / 5% = 1,64

Da Investmentfonds A einen niedrigeren Variationskoeffizienten aufweist, bietet er eine bessere mittlere Rendite im Vergleich zur Standardabweichung.

Berechnung des Variationskoeffizienten in R

Um den Variationskoeffizienten für einen Datensatz in R zu berechnen, können Sie die folgende Syntax verwenden:

cv <- sd(data) / mean(data) * 100

Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis verwendet wird.

Beispiel 1: Variationskoeffizient für einen einzelnen Vektor

Der folgende Code zeigt, wie der CV für einen einzelnen Vektor berechnet wird:

#Vektor von Daten erstellen
data <- c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82)

#CV berechnen
cv <- sd(data) / mean(data) * 100

# CV anzeigen
cv

[1] 9.234518

Der Variationskoeffizient beträgt 9,23.

Beispiel 2: Variationskoeffizient für mehrere Vektoren

Der folgende Code zeigt, wie der CV für mehrere Vektoren in einem Dataframe mithilfe der Funktion sapply() berechnet wird:

#Dataframe erstellen
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, 92, 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, 84))

#CV für jede Spalte im Dataframe berechnen
sapply(data, function(x) sd(x) / mean(x) * 100)

        a         b         c 
11.012892  8.330843  7.154009

Stellen Sie sicher, dass Sie na.rm = T verwenden, wenn auch in Ihren Daten Werte fehlen. Dies weist R an, die fehlenden Werte bei der Berechnung des Variationskoeffizienten einfach zu ignorieren:

#Dataframe erstellen
data <- data.frame(a=c(88, 85, 82, 97, 67, 77, 74, 86, 81, 95),
                   b=c(77, 88, 85, 76, 81, 82, 88, 91, NA, 99),
                   c=c(67, 68, 68, 74, 74, 76, 76, 77, 78, NA))

#CV für jede Spalte im Dataframe berechnen
sapply(data, function(x) sd(x, na.rm=T) / mean(x, na.rm=T) * 100)

        a         b         c 
11.012892  8.497612  5.860924

Zusätzliche Ressourcen

Berechnen der Standardabweichung in R
So finden Sie den Bereich in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: