Ein Variationskoeffizient, oft als CV abgekürzt, ist eine Methode, um zu messen, wie verteilt Werte in einem Datensatz relativ zum Mittelwert sind. Es wird berechnet als:

CV = σ / μ

wo:

  • σ: Die Standardabweichung des Datensatzes
  • μ: Der Mittelwert des Datensatzes

Im Klartext ist der Variationskoeffizient einfach das Verhältnis zwischen der Standardabweichung und dem Mittelwert.

Wann ist der Variationskoeffizient zu verwenden?

Der Variationskoeffizient wird häufig verwendet, um die Variation zwischen zwei verschiedenen Datensätzen zu vergleichen.

In der realen Welt wird es häufig im Finanzbereich verwendet, um die durchschnittliche erwartete Rendite einer Investition mit der erwarteten Standardabweichung der Investition zu vergleichen. Dies ermöglicht es den Anlegern, den Risiko-Rendite-Kompromiss zwischen Anlagen zu vergleichen.

Angenommen, ein Anleger erwägt, in die folgenden zwei Investmentfonds zu investieren:

Investmentfonds A: Mittelwert = 9%, Standardabweichung = 12,4%

Investmentfonds B: Mittelwert = 5%, Standardabweichung = 8,2%

Bei der Berechnung des Variationskoeffizienten für jeden Fonds stellt der Anleger Folgendes fest:

Lebenslauf für Investmentfonds A = 12,4% / 9% = 1,38

Lebenslauf für Investmentfonds B = 8,2% / 5% = 1,64

Da Investmentfonds A einen niedrigeren Variationskoeffizienten aufweist, bietet er eine bessere mittlere Rendite im Vergleich zur Standardabweichung.

So berechnen Sie den Variationskoeffizienten in Python

Um den Variationskoeffizienten für ein Dataset in Python zu berechnen, können Sie die folgende Syntax verwenden:

import numpy as np

cv = lambda x: np.std(x, ddof=1) / np.mean(x) * 100

Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis verwendet wird.

Beispiel 1: Variationskoeffizient für ein einzelnes Array

Der folgende Code zeigt, wie der Lebenslauf für ein einzelnes Array berechnet wird:

#Vektor von Daten erstellen
data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81, 82]

#Funktion zur Berechnung des Lebenslaufs definieren
cv = lambda x: np.std(x, ddof=1) / np.mean(x) * 100 

# Lebenslauf berechnen
cv(data)

9.234518

Der Variationskoeffizient beträgt 9,23.

Beispiel 2: Variationskoeffizient für mehrere Vektoren

Der folgende Code zeigt, wie der Lebenslauf für mehrere Spalten in einem Pandas DataFrame berechnet wird:

import numpy as np
import pandas as pd

# Funktion zur Berechnung des Lebenslaufs definieren
cv = lambda x: np.std(x, ddof=1) / np.mean(x) * 100 

# Pandas DataFrame erstellen
df = pd.DataFrame({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, 92, 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, 84]})

# CV für jede Spalte im Dataframe berechnen
df.apply(cv)

a    11.012892
b     8.330843
c     7.154009
dtype: float64

Beachten Sie, dass fehlende Werte bei der Berechnung des Variationskoeffizienten einfach ignoriert werden:

import numpy as np
import pandas as pd

# Funktion zur Berechnung des Lebenslaufs definieren
cv = lambda x: np.std(x, ddof=1) / np.mean(x) * 100 

# Pandas DataFrame erstellen
df = pd.DataFrame({'a': [88, 85, 82, 97, 67, 77, 74, 86, 81, 95],
                   'b': [77, 88, 85, 76, 81, 82, 88, 91, np.nan, 99],
                   'c': [67, 68, 68, 74, 74, 76, 76, 77, 78, np.nan]})

# CV für jede Spalte im Dataframe berechnen
df.apply(cv)

a    11.012892
b     8.497612
c     5.860924
dtype: float64

Zusätzliche Ressourcen

Wie berechnet man den Variationskoeffizienten in R
So berechnen Sie den Variationskoeffizienten in Excel
So berechnen Sie den Variationskoeffizienten in Google Tabellen

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: