Wie man Schiefe & Kurtosis in Python berechnet

Von Fabian
Kategorie: Python
Lesezeit: 3 Minuten

In der Statistik sind Schiefe und Kurtosis zwei Möglichkeiten, um die Form einer Verteilung zu messen.

Die Schiefe ist ein Maß für die Asymmetrie einer Verteilung. Dieser Wert kann positiv oder negativ sein.

  • Ein negativer Versatz zeigt an, dass es sich um eine nach links geneigte Verteilung handelt, die sich in Richtung negativerer Werte erstreckt.
  • Ein positiver Versatz zeigt an, dass es sich um eine nach rechts geneigte Verteilung handelt, was sich in Richtung positiverer Werte erstreckt.
  • Ein Wert von Null zeigt an, dass die Verteilung überhaupt keine Schiefe aufweist, was bedeutet, dass die Verteilung perfekt symmetrisch ist.

Die Kurtosis ist ein Maß dafür, ob eine Verteilung im Vergleich zu einer Normalverteilung eine starke oder weniger Starke links- oder rechtsschiefe Verteilung hat.

  • Die Kurtosis einer Normalverteilung beträgt 3.
  • Wenn eine gegebene Verteilung eine Kurtosis von weniger als 3 aufweist, wird sie als platykurtisch bezeichnet, was bedeutet, dass sie dazu neigt, immer weniger extreme Ausreißer als die Normalverteilung zu erzeugen.
  • Wenn eine bestimmte Verteilung eine Kurtosis von mehr als 3 aufweist, wird sie als leptokurtisch bezeichnet, was bedeutet, dass sie tendenziell mehr Ausreißer als die Normalverteilung erzeugt.

Hinweis: Einige Formeln (Fisher-Definition) subtrahieren 3 von der Kurtosis, um den Vergleich mit der Normalverteilung zu erleichtern. Unter Verwendung dieser Definition hätte eine Verteilung eine Kurtosis größer als eine Normalverteilung, wenn sie einen Kurtosiswert größer als 0 hätte.

In diesem Tutorial wird erläutert, wie Sie sowohl die Schiefe als auch die Kurtosis eines bestimmten Datensatzes in Python berechnen.

Beispiel: Skewness & Kurtosis in Python

Angenommen, wir haben den folgenden Datensatz:

data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

Um die Sample-Skewness und Sample-Kurtosis dieses Datensatzes zu berechnen, können wir die Funktionen skew() und kurt() aus der Scipy Stata-Bibliothek mit der folgenden Syntax verwenden:

  • skew(array of values, bias=False)
  • kurt(array of values, bias=False)

Wir verwenden das Argument bias=False, um die Stichprobenschiefe und Kurtosis im Gegensatz zur Populationsschiefe und Kurtosis zu berechnen.

So verwenden Sie diese Funktionen für unseren speziellen Datensatz:

data = [88, 85, 82, 97, 67, 77, 74, 86, 81, 95, 77, 88, 85, 76, 81]

# Probenschiefe berechnen
skew(data, bias=False)

0.032697

# Probe Kurtosis berechnen
kurtosis(data, bias=False)

0.118157

Die Schiefe beträgt 0,032697 und die Kurtosis 0,118157.

Dies bedeutet, dass die Verteilung leicht positiv verzerrt ist und die Verteilung im Vergleich zu einer Normalverteilung mehr Werte in den Schwänzen aufweist.

Zusätzliche Ressource: Skewness & Kurtosis Calculator

Sie können die Schiefe für einen bestimmten Datensatz auch mit dem Statologie-Schiefe- und Kurtosis-Rechner berechnen, der automatisch sowohl die Schiefe als auch die Kurtosis für einen bestimmten Datensatz berechnet.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: