Sie können die folgende Formel verwenden, um eine Median-IF-Funktion in Google Tabellen auszuführen:
=MEDIAN(IF(GROUP_RANGE=VALUE, MEDIAN_RANGE))
Diese Formel findet den Mittelwert aller Zellen in einem bestimmten Bereich, die …
Ein Ausreißer ist eine Beobachtung, die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausreißer können problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen können.
In diesem Tutorial wird erläutert, wie Sie Ausreißer in SPSS identifizieren und behandeln.
Angenommen, wir haben den folgenden Datensatz, der das jährliche Einkommen (in Tausend) für 15 Personen zeigt:
Eine Möglichkeit, festzustellen, ob Ausreißer vorhanden sind, besteht darin, ein Box-Diagramm für das Dataset zu erstellen. Klicken Sie dazu auf die Registerkarte Analysieren, dann auf Beschreibende Statistik und dann auf Durchsuchen:
Ziehen Sie im neuen Fenster, das angezeigt wird, die Variable income in das Feld Abhängige Liste. Klicken Sie dann auf Statistik und stellen Sie sicher, dass das Kontrollkästchen neben Perzentile aktiviert ist. Klicken Sie dann auf Weiter. Klicken Sie dann auf OK.
Sobald Sie auf OK klicken, wird ein Boxplot angezeigt:
Wenn an beiden Enden des Boxplots keine Kreise oder Sternchen vorhanden sind, ist dies ein Hinweis darauf, dass keine Ausreißer vorhanden sind.
SPSS betrachtet jeden Datenwert als Ausreißer, wenn er außerhalb der folgenden Bereiche liegt:
Wir können den Interquartilsabstand berechnen, indem wir die Differenz zwischen dem 75. und dem 25. Perzentil in der Zeile mit der Bezeichnung Tukey’s Hinges in der Ausgabe nehmen:
Für diesen Datensatz beträgt der Interquartilsabstand 82 – 36 = 46. Daher werden alle Werte außerhalb der folgenden Bereiche als Ausreißer betrachtet:
Offensichtlich kann das Einkommen nicht negativ sein, daher ist die Untergrenze in diesem Beispiel nicht sinnvoll. Ein Einkommen über 151 würde jedoch als Ausreißer betrachtet.
Angenommen, der größte Wert in unserem Datensatz war stattdessen 152. Hier ist der Box-Plot für diesen Datensatz:
Der Kreis ist ein Hinweis darauf, dass in den Daten ein Ausreißer vorhanden ist. Die Zahl 15 gibt an, welche Beobachtung im Datensatz der Ausreißer ist.
SPSS betrachtet jeden Datenwert auch als extremen Ausreißer, wenn er außerhalb der folgenden Bereiche liegt:
Daher werden Werte außerhalb der folgenden Bereiche in diesem Beispiel als extreme Ausreißer betrachtet:
Angenommen, der größte Wert in unserem Datensatz war 221. Hier ist der Box-Plot für diesen Datensatz:
Das Sternchen (*) zeigt an, dass in den Daten ein extremer Ausreißer vorhanden ist. Die Zahl 15 gibt an, welche Beobachtung im Datensatz der extreme Ausreißer ist.
Wenn in Ihren Daten ein Ausreißer vorhanden ist, haben Sie einige Möglichkeiten:
1. Stellen Sie sicher, dass der Ausreißer nicht das Ergebnis eines Dateneingabefehlers ist.
Manchmal gibt eine Person beim Aufzeichnen von Daten einfach den falschen Datenwert ein. Wenn ein Ausreißer vorhanden ist, überprüfen Sie zunächst, ob der Wert korrekt eingegeben wurde und ob es sich nicht um einen Fehler handelt.
2. Entfernen Sie den Ausreißer.
Wenn der Wert ein echter Ausreißer ist, können Sie ihn entfernen, wenn er erhebliche Auswirkungen auf Ihre Gesamtanalyse hat. Stellen Sie einfach sicher, dass Sie in Ihrem Abschlussbericht oder Ihrer Analyse erwähnen, dass Sie einen Ausreißer entfernt haben.
3. Weisen Sie dem Ausreißer einen neuen Wert zu.
Wenn sich herausstellt, dass der Ausreißer auf einen Dateneingabefehler zurückzuführen ist, können Sie ihm einen neuen Wert zuweisen, z. B. den Mittelwert oder den Median des Datensatzes.
Sie können die folgende Formel verwenden, um eine Median-IF-Funktion in Google Tabellen auszuführen:
=MEDIAN(IF(GROUP_RANGE=VALUE, MEDIAN_RANGE))
Diese Formel findet den Mittelwert aller Zellen in einem bestimmten Bereich, die …
Die prozentuale Änderung der Werte zwischen einer Periode und einer anderen Periode wird wie folgt berechnet:
Prozentuale Änderung = (Wert 2 – Wert 1 ) / Wert 1 * 100
Angenommen, ein Unternehmen macht in …