In der Statistik sind wir oft daran interessiert zu wissen, wie „verteilt“ die Werte in einer Verteilung sind.

Eine beliebte Methode zur Messung der Streuung ist der Interquartilsabstand, der als Differenz zwischen dem ersten und dem dritten Quartil in einem Datensatz berechnet wird. Quartile sind einfach Werte, die einen Datensatz in vier gleiche Teile aufteilen.

Beispiel: Berechnung des Interquartilsabstand

Das folgende Beispiel zeigt, wie der Interquartilsabstand für einen bestimmten Datensatz berechnet wird:

Varianz und Standardabweichung eines Datensatzes

Schritt 1: Ordnen Sie die Werte vom kleinsten zum größten.

58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88, 88, 88, 90, 90, 92, 92, 94, 96, 98

2. Finden Sie den Median.

58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88, 88, 88, 90, 90, 92, 92, 94, 96, 98

In diesem Fall liegt der Median zwischen 85 und 88.

3. Der Median teilt den Datensatz in zwei Hälften. Der Median der unteren Hälfte ist das untere Quartil und der Median der oberen Hälfte ist das obere Quartil:

58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88, 88, 88, 90, 90, 92, 92, 94, 96, 98

4. Berechnen Sie den Interquartilsabstand.

In diesem Fall ist das erste Quartil der Durchschnitt der beiden mittleren Werte in der unteren Hälfte des Datensatzes (75,5) und das dritte Quartil der Durchschnitt der beiden mittleren Werte in der oberen Hälfte des Datensatzes (91).

Somit liegt der Interquartilsabstand zwischen 91 und 75,5 = 15,5

Der Interquartilsabstand wird von Ausreißern nicht beeinflusst

Ein Grund, warum Menschen den Interquartilsabstand ((engl. Interquartile Range = IQR)) bei der Berechnung der „Streuung“ eines Datensatzes bevorzugen, ist die Beständigkeit gegen Ausreißer. Da der (engl. Interquartile Range = IQR) einfach der Bereich der mittleren 50% der Datenwerte ist, wird er nicht von extremen Ausreißern beeinflusst.

Betrachten Sie den folgenden Datensatz, um dies zu demonstrieren:

[1, 4, 8, 11, 13, 17, 17, 20]

Hier sind die verschiedenen Ausbreitungsmaße für diesen Datensatz:

  • Interquartilsabstand: 11
  • Reichweite: 19
  • Standardabweichung: 6.26
  • Varianz: 39,23

Betrachten Sie nun denselben Datensatz, dem jedoch ein extremer Ausreißer hinzugefügt wurde:

[1, 4, 8, 11, 13, 17, 17, 20, 150 ]

Hier sind die verschiedenen Ausbreitungsmaße für diesen Datensatz:

  • Interquartilsabstand: 12,5
  • Reichweite: 149
  • Standardabweichung: 43,96
  • Varianz: 1.932,84

Beachten Sie, dass sich der Interquartilsabstand nur geringfügig von 11 auf 12,5 ändert. Alle anderen Dispersionsmaße ändern sich jedoch drastisch.

Dies zeigt, dass der Interquartilsabstand nicht wie die anderen Dispersionsmaße von Ausreißern beeinflusst wird. Aus diesem Grund ist dies eine zuverlässige Methode, um die Streuung der mittleren 50% der Werte in einer Verteilung zu messen.

Weiterführende Literatur:

Dispersionsmaße

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: