So finden Sie Ausreißer einfach in Excel

Von Fabian
Kategorie: Excel
Lesezeit: 3 Minuten

Ein Ausreißer ist eine Beobachtung, die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausreißer können problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen können.

Wir werden den folgenden Datensatz in Excel verwenden, um zwei Methoden zum Auffinden von Ausreißern zu veranschaulichen:

(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)

Outlierexcel

Methode 1: Verwenden Sie den Interquartilsabstand

Der Interquartilsabstand ((engl. Interquartile Range = IQR)) ist die Differenz zwischen dem 75. Perzentil (Q3) und dem 25. Perzentil (Q1) in einem Datensatz. Es misst die Streuung der mittleren 50% der Werte.

Wir können eine Beobachtung als Ausreißer definieren, wenn sie das 1,5-fache des Interquartilsabstands größer als das dritte Quartil (Q3) oder das 1,5-fache des Interquartilsabstands kleiner als das erste Quartil (Q1) ist.

Das folgende Bild zeigt, wie der Interquartilsabstand in Excel berechnet wird:

Outlierexcel

Als nächstes können wir die oben erwähnte Formel verwenden, um jedem Wert, der ein Ausreißer im Datensatz ist, eine „1“ zuzuweisen:

Ausreißer in Excel finden

Wir sehen, dass sich nur ein Wert - 164 - in diesem Datensatz als Ausreißer herausstellt.

Methode 2: Verwenden Sie Z-Scores

Ein Z-Score gibt an, wie viele Standardabweichungen ein bestimmter Wert vom Mittelwert aufweist. Wir verwenden die folgende Formel, um einen Z-Score zu berechnen:

z = (X - μ) / σ

wo:

  • X ist ein einzelner Rohdatenwert
  • μ ist der Populationsmittelwert
  • σ ist die Populationsstandardabweichung Wir können eine Beobachtung als Ausreißer definieren, wenn sie einen Z-Score von weniger als -3 oder mehr als 3 hat.

Das folgende Bild zeigt, wie der Mittelwert und die Standardabweichung für einen Datensatz in Excel berechnet werden:

Outlierexcel

Wir können dann den Mittelwert und die Standardabweichung verwenden, um den Z-Score für jeden einzelnen Wert im Datensatz zu ermitteln:

Outlierexcel

Wir können dann jedem Wert, dessen Z-Score kleiner als -3 oder größer als 3 ist, eine „1“ zuweisen:

Ausreißer in Excel mithilfe von Z-Scores finden

Mit dieser Methode sehen wir, dass das Dataset keine Ausreißer enthält.

Hinweis: Manchmal wird ein Z-Score von 2,5 anstelle von 3 verwendet. In diesem Fall wird der Einzelwert von 164 als Ausreißer betrachtet, da er einen Z-Score von mehr als 2,5 aufweist. Verwenden Sie bei der Verwendung der Z-Score-Methode nach bestem Wissen, welchen Z-Score-Wert Sie als Ausreißer betrachten.

Umgang mit Ausreißern

Wenn in Ihren Daten ein Ausreißer vorhanden ist, haben Sie einige Möglichkeiten:

1. Stellen Sie sicher, dass der Ausreißer nicht das Ergebnis eines Dateneingabefehlers ist.

Manchmal gibt eine Person beim Aufzeichnen von Daten einfach den falschen Datenwert ein. Wenn ein Ausreißer vorhanden ist, überprüfen Sie zunächst, ob der Wert korrekt eingegeben wurde und ob es sich nicht um einen Fehler handelt.

2. Entfernen Sie den Ausreißer.

Wenn der Wert ein echter Ausreißer ist, können Sie ihn entfernen, wenn er erhebliche Auswirkungen auf Ihre Gesamtanalyse hat. Stellen Sie einfach sicher, dass Sie in Ihrem Abschlussbericht oder Ihrer Analyse erwähnen, dass Sie einen Ausreißer entfernt haben.

3. Weisen Sie dem Ausreißer einen neuen Wert zu.

Wenn der Ausreißer das Ergebnis eines Dateneingabefehlers ist, können Sie ihm einen neuen Wert zuweisen, z. B. den Mittelwert oder den Median des Datensatzes.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: