Ein Ausreißer ist eine Beobachtung, die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt liegt.

Wir definieren eine Beobachtung häufig als Ausreißer, wenn sie um das 1,5-fache des Interquartilabstands größer als das dritte Quartil oder um das 1,5-fache des Interquartilabstands kleiner als das erste Quartil ist.

Hinweis: Der Quartilabstand ist die Differenz zwischen dem dritten Quartil (75. Perzentil) und dem ersten Quartil (25. Perzentil) in einem Datensatz. Er misst die Streuung der mittleren 50% der Werte.

Das folgende Schritt-für-Schritt-Beispiel zeigt, wie Sie diese Formel verwenden, um Ausreißer in einem Datensatz in Google Tabellen zu finden.

Schritt 1: Geben Sie die Daten ein

Lassen Sie uns zunächst die Werte für den folgenden Datensatz in Google Tabellen eingeben:

Ausreißerblätter

Schritt 2: Berechnen Sie den Interquartilbereich

Als Nächstes berechnen wir das erste Quartil, das dritte Quartil und den Interquartilbereich des Datensatzes:

Ausreißerblätter

Schritt 3: Identifizieren Sie Ausreißer

Als Nächstes können wir die folgende Formel verwenden, um jedem Wert, der ein Ausreißer im Datensatz ist, eine „1“ zuzuweisen:

=IF(A2<$B$18-$B$20*1.5, 1, IF(A2>$B$19+$B$20*1.5, 1, 0))

Diese Formel prüft, ob eine Beobachtung um das 1,5-fache des Interquartilabstands größer als das dritte Quartil oder um das 1,5-fache des Interquartilabstands kleiner als das erste Quartil ist.

Wenn beides zutrifft, wird der Beobachtung eine „1“ zugewiesen, um sie als Ausreißer zu kennzeichnen.

Der folgende Screenshot zeigt, wie Sie diese Formel in der Praxis verwenden:

Ausreißer in Google Tabellen finden

Wir sehen, dass sich nur ein Wert in unserem Datensatz als Ausreißer herausstellt: 164.

Umgang mit Ausreißern

Wenn Ihre Daten einen Ausreißer enthalten, haben Sie mehrere Möglichkeiten:

1. Stellen Sie sicher, dass der Ausreißer nicht das Ergebnis eines Dateneingabefehlers ist.

Manchmal werden einfache Daten falsch aufgezeichnet. Wenn ein Ausreißer vorhanden ist, überprüfen Sie zunächst, ob der Wert korrekt eingegeben wurde und es sich nicht um einen Fehler handelt.

2. Weisen Sie dem Ausreißer einen neuen Wert zu.

Wenn der Ausreißer das Ergebnis eines Dateneingabefehlers ist, können Sie ihm einen neuen Wert zuweisen, z. B. den Mittelwert oder den Median des Datensatzes.

3. Entfernen Sie den Ausreißer.

Wenn der Wert ein echter Ausreißer ist, können Sie ihn entfernen, wenn er einen erheblichen Einfluss auf Ihre Gesamtanalyse hat. Stellen Sie einfach sicher, dass Sie in Ihrem Abschlussbericht erwähnen, dass Sie einen Ausreißer entfernt haben.

Zusätzliche Ressourcen

Die folgenden Tutorials erläutern, wie Sie Ausreißer in anderer Statistiksoftware entfernen:

So entfernen Sie Ausreißer in R
So entfernen Sie Ausreißer in Python
So entfernen Sie Ausreißer in SPSS

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: