So identifizieren Sie Ausreißer in SPSS

Von Fabian
Kategorie: SPSS
Lesezeit: 3 Minuten

Ein Ausreißer ist eine Beobachtung, die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausreißer können problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen können.

In diesem Tutorial wird erläutert, wie Sie Ausreißer in SPSS identifizieren und behandeln.

So identifizieren Sie Ausreißer in SPSS

Angenommen, wir haben den folgenden Datensatz, der das jährliche Einkommen (in Tausend) für 15 Personen zeigt:

Ausreißer SPSS 1

Eine Möglichkeit, festzustellen, ob Ausreißer vorhanden sind, besteht darin, ein Box-Diagramm für das Dataset zu erstellen. Klicken Sie dazu auf die Registerkarte Analysieren, dann auf Beschreibende Statistik und dann auf Durchsuchen:

Ausreißer SPSS 2

Ziehen Sie im neuen Fenster, das angezeigt wird, die Variable income in das Feld Abhängige Liste. Klicken Sie dann auf Statistik und stellen Sie sicher, dass das Kontrollkästchen neben Perzentile aktiviert ist. Klicken Sie dann auf Weiter. Klicken Sie dann auf OK.

Ausreißer SPSS 3

Sobald Sie auf OK klicken, wird ein Boxplot angezeigt:

Boxplot in SPSS

Wenn an beiden Enden des Boxplots keine Kreise oder Sternchen vorhanden sind, ist dies ein Hinweis darauf, dass keine Ausreißer vorhanden sind.

SPSS betrachtet jeden Datenwert als Ausreißer, wenn er außerhalb der folgenden Bereiche liegt:

    1. Quartil + 1,5 * Interquartilsabstand
    1. Quartil – 1,5 * Interquartilsabstand

Wir können den Interquartilsabstand berechnen, indem wir die Differenz zwischen dem 75. und dem 25. Perzentil in der Zeile mit der Bezeichnung Tukey’s Hinges in der Ausgabe nehmen:

Tukey's Hinges Interquartilsabstand in SPSS

Für diesen Datensatz beträgt der Interquartilsabstand 82 – 36 = 46. Daher werden alle Werte außerhalb der folgenden Bereiche als Ausreißer betrachtet:

  • 82 + 1,5 * 46 = 151
  • 36 – 1,5 * 46 = -33

Offensichtlich kann das Einkommen nicht negativ sein, daher ist die Untergrenze in diesem Beispiel nicht sinnvoll. Ein Einkommen über 151 würde jedoch als Ausreißer betrachtet.

Angenommen, der größte Wert in unserem Datensatz war stattdessen 152. Hier ist der Box-Plot für diesen Datensatz:

Boxplot mit Ausreißer in SPSS

Der Kreis ist ein Hinweis darauf, dass in den Daten ein Ausreißer vorhanden ist. Die Zahl 15 gibt an, welche Beobachtung im Datensatz der Ausreißer ist.

SPSS betrachtet jeden Datenwert auch als extremen Ausreißer, wenn er außerhalb der folgenden Bereiche liegt:

    1. Quartil + 3 * Interquartilsabstand
    1. Quartil – 3 * Interquartilsabstand

Daher werden Werte außerhalb der folgenden Bereiche in diesem Beispiel als extreme Ausreißer betrachtet:

  • 82 + 3 * 46 = 220
  • 36 – 3 * 46 = -102

Angenommen, der größte Wert in unserem Datensatz war 221. Hier ist der Box-Plot für diesen Datensatz:

Extremer Ausreißer in einem Boxplot in SPSS

Das Sternchen (*) zeigt an, dass in den Daten ein extremer Ausreißer vorhanden ist. Die Zahl 15 gibt an, welche Beobachtung im Datensatz der extreme Ausreißer ist.

Umgang mit Ausreißern

Wenn in Ihren Daten ein Ausreißer vorhanden ist, haben Sie einige Möglichkeiten:

1. Stellen Sie sicher, dass der Ausreißer nicht das Ergebnis eines Dateneingabefehlers ist.

Manchmal gibt eine Person beim Aufzeichnen von Daten einfach den falschen Datenwert ein. Wenn ein Ausreißer vorhanden ist, überprüfen Sie zunächst, ob der Wert korrekt eingegeben wurde und ob es sich nicht um einen Fehler handelt.

2. Entfernen Sie den Ausreißer.

Wenn der Wert ein echter Ausreißer ist, können Sie ihn entfernen, wenn er erhebliche Auswirkungen auf Ihre Gesamtanalyse hat. Stellen Sie einfach sicher, dass Sie in Ihrem Abschlussbericht oder Ihrer Analyse erwähnen, dass Sie einen Ausreißer entfernt haben.

3. Weisen Sie dem Ausreißer einen neuen Wert zu.

Wenn sich herausstellt, dass der Ausreißer auf einen Dateneingabefehler zurückzuführen ist, können Sie ihm einen neuen Wert zuweisen, z. B. den Mittelwert oder den Median des Datensatzes.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: