Sie können die folgende Formel verwenden, um eine Median-IF-Funktion in Google Tabellen auszuführen:
=MEDIAN(IF(GROUP_RANGE=VALUE, MEDIAN_RANGE))
Diese Formel findet den Mittelwert aller Zellen in einem bestimmten Bereich, die …
Ein Ausreißer ist eine Beobachtung, die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausreißer können problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen können.
Wir werden den folgenden Datensatz in Excel verwenden, um zwei Methoden zum Auffinden von Ausreißern zu veranschaulichen:
(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)
Der Interquartilsabstand ((engl. Interquartile Range = IQR)) ist die Differenz zwischen dem 75. Perzentil (Q3) und dem 25. Perzentil (Q1) in einem Datensatz. Es misst die Streuung der mittleren 50% der Werte.
Wir können eine Beobachtung als Ausreißer definieren, wenn sie das 1,5-fache des Interquartilsabstands größer als das dritte Quartil (Q3) oder das 1,5-fache des Interquartilsabstands kleiner als das erste Quartil (Q1) ist.
Das folgende Bild zeigt, wie der Interquartilsabstand in Excel berechnet wird:
Als nächstes können wir die oben erwähnte Formel verwenden, um jedem Wert, der ein Ausreißer im Datensatz ist, eine „1“ zuzuweisen:
Wir sehen, dass sich nur ein Wert - 164 - in diesem Datensatz als Ausreißer herausstellt.
Ein Z-Score gibt an, wie viele Standardabweichungen ein bestimmter Wert vom Mittelwert aufweist. Wir verwenden die folgende Formel, um einen Z-Score zu berechnen:
z = (X - μ) / σ
wo:
Das folgende Bild zeigt, wie der Mittelwert und die Standardabweichung für einen Datensatz in Excel berechnet werden:
Wir können dann den Mittelwert und die Standardabweichung verwenden, um den Z-Score für jeden einzelnen Wert im Datensatz zu ermitteln:
Wir können dann jedem Wert, dessen Z-Score kleiner als -3 oder größer als 3 ist, eine „1“ zuweisen:
Mit dieser Methode sehen wir, dass das Dataset keine Ausreißer enthält.
Hinweis: Manchmal wird ein Z-Score von 2,5 anstelle von 3 verwendet. In diesem Fall wird der Einzelwert von 164 als Ausreißer betrachtet, da er einen Z-Score von mehr als 2,5 aufweist. Verwenden Sie bei der Verwendung der Z-Score-Methode nach bestem Wissen, welchen Z-Score-Wert Sie als Ausreißer betrachten.
Wenn in Ihren Daten ein Ausreißer vorhanden ist, haben Sie einige Möglichkeiten:
1. Stellen Sie sicher, dass der Ausreißer nicht das Ergebnis eines Dateneingabefehlers ist.
Manchmal gibt eine Person beim Aufzeichnen von Daten einfach den falschen Datenwert ein. Wenn ein Ausreißer vorhanden ist, überprüfen Sie zunächst, ob der Wert korrekt eingegeben wurde und ob es sich nicht um einen Fehler handelt.
2. Entfernen Sie den Ausreißer.
Wenn der Wert ein echter Ausreißer ist, können Sie ihn entfernen, wenn er erhebliche Auswirkungen auf Ihre Gesamtanalyse hat. Stellen Sie einfach sicher, dass Sie in Ihrem Abschlussbericht oder Ihrer Analyse erwähnen, dass Sie einen Ausreißer entfernt haben.
3. Weisen Sie dem Ausreißer einen neuen Wert zu.
Wenn der Ausreißer das Ergebnis eines Dateneingabefehlers ist, können Sie ihm einen neuen Wert zuweisen, z. B. den Mittelwert oder den Median des Datensatzes.
Sie können die folgende Formel verwenden, um eine Median-IF-Funktion in Google Tabellen auszuführen:
=MEDIAN(IF(GROUP_RANGE=VALUE, MEDIAN_RANGE))
Diese Formel findet den Mittelwert aller Zellen in einem bestimmten Bereich, die …
Die prozentuale Änderung der Werte zwischen einer Periode und einer anderen Periode wird wie folgt berechnet:
Prozentuale Änderung = (Wert 2 – Wert 1 ) / Wert 1 * 100
Angenommen, ein Unternehmen macht in …