Sie können die folgende Formel verwenden, um eine Median-IF-Funktion in Google Tabellen auszuführen:
=MEDIAN(IF(GROUP_RANGE=VALUE, MEDIAN_RANGE))
Diese Formel findet den Mittelwert aller Zellen in einem bestimmten Bereich, die …
In der Statistik sind wir häufig daran interessiert zu verstehen, wie ein Datensatz verteilt ist. Insbesondere sind vier Dinge hilfreich, die Sie über eine Distribution wissen sollten:
1. Form
2. Ausreißer
3. Mitte
4. Ausbreitung
FAMA ist ein nützliches Akronym, mit dem wir uns an diese vier Dinge erinnern können. Es steht für „Form, Ausreißer, Mitte, Ausbreitung“.
Lassen Sie uns ein einfaches Beispiel für die Verwendung von FAMA zur Beschreibung einer Verteilung durchgehen.
Angenommen, wir haben den folgenden Datensatz, der die Höhe einer Probe von 20 verschiedenen Pflanzen zeigt.
So können wir FAMA verwenden, um diese Verteilung von Datenwerten zu beschreiben.
Zunächst wollen wir die Form der Verteilung beschreiben.
Eine hilfreiche Möglichkeit, die Form der Verteilung zu visualisieren, besteht darin, ein Histogramm zu erstellen, in dem die Häufigkeit aller Werte im Datensatz angezeigt wird:
Ist die Verteilung symmetrisch oder zur Seite geneigt? Aus dem Histogramm können wir erkennen, dass die Verteilung ungefähr symmetrisch ist. Das heißt, die Werte sind nicht auf die eine oder andere Seite verschoben.
Ist die Verteilung unimodal (ein Peak) oder bimodal (zwei Peaks)? Die Verteilung ist unimodal. Es hat einen Peak beim Wert „7“.
Als Nächstes möchten wir feststellen, ob der Datensatz Ausreißer enthält. Aus dem Histogramm können wir die Verteilung visuell untersuchen und feststellen, dass 22 möglicherweise ein Ausreißer ist:
Ein üblicher Weg, einen Ausreißer formal zu definieren, ist ein Wert, der das 1,5-fache des Interquartilabstands über dem dritten Quartil oder unter dem ersten Quartil beträgt.
Mit einem Interquartilsabstandsrechner können wir die 20 Rohdatenwerte eingeben und feststellen, dass das dritte Quartil 9 ist, der Interquartisabstand 3 ist und daher jeder Wert über 9 + (1,5 * 3) = 13,5 per Definition ein Ausreißer ist.
Da 22 größer als 13,5 ist, können wir 22 als Ausreißer deklarieren.
Als nächstes wollen wir beschreiben, wo sich das Zentrum der Verteilung befindet. Drei gängige Maße für die zentrale Tendenz, die wir verwenden können, sind der Mittelwert, der Median und der Modus.
Mittelwert: Dies ist der Durchschnittswert in der Verteilung. Wir finden dies, indem wir alle Einzelwerte addieren und dann durch die Gesamtzahl der Werte dividieren:
Mittelwert = (8 + 4 + 6 + 7 + 7 + 6 + 7 + 8 + 6 + 11 + 8 + 22 + 10 + 9 + 9 + 7 + 5 + 7 + 6 + 4) / 20 = 7.85
Median: Dies ist der „mittlere“ Wert in der Verteilung. Wir finden dies, indem wir alle Werte vom kleinsten zum größten anordnen und dann den mittleren Wert identifizieren. Dies stellt sich als 7 heraus.
4, 4, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 9, 9, 10, 11, 22
Modus: Dies ist der Wert, der am häufigsten auftritt. Dies stellt sich als 7 heraus.
Als nächstes wollen wir beschreiben, wie verteilt die Werte in der Verteilung sind. Vier gängige Dispersionsmaße, die wir verwenden können, sind der Bereich, der Interquarilbereich, die Standardabweichung und die Varianz.
Bereich: Dies ist die Differenz zwischen dem größten und dem kleinsten Wert im Datensatz. Dies stellt sich als 22 – 4 = 18 heraus.
Interquartilsabstand: Hiermit wird die Breite der mittleren 50% der Datenwerte gemessen. Anhand der Eingabe der 20 Rohdatenwerte in einen Interquartilstabstandsrechner können wir erkennen, dass dies gleich 3 ist.
Standardabweichung: Dies ist ein Maß dafür, wie verteilt die Datenwerte im Durchschnitt sind. Aus der Eingabe der 20 Rohdatenwerte in den Varianz- und Standardabweichungsrechner können wir erkennen, dass die Standardabweichung gleich 3.69 ist.
Varianz: Dies ist einfach die quadratische Standardabweichung. Dies entspricht 3.69 2 = 13.63.
Durch die Verwendung von FAMA als Leitfaden konnten wir die Verteilung der Pflanzenhöhen folgendermaßen beschreiben:
Beachten Sie, dass wir FAMA verwenden können, um jede Verteilung zu beschreiben. Dies ist eine hilfreiche Methode, um ein gutes Verständnis der Form einer Verteilung zu erlangen, wenn sie Ausreißer aufweist, wo sich das Zentrum ungefähr befindet und wie sich die Datenwerte verteilen sind.
Sie können die folgende Formel verwenden, um eine Median-IF-Funktion in Google Tabellen auszuführen:
=MEDIAN(IF(GROUP_RANGE=VALUE, MEDIAN_RANGE))
Diese Formel findet den Mittelwert aller Zellen in einem bestimmten Bereich, die …
Die prozentuale Änderung der Werte zwischen einer Periode und einer anderen Periode wird wie folgt berechnet:
Prozentuale Änderung = (Wert 2 – Wert 1 ) / Wert 1 * 100
Angenommen, ein Unternehmen macht in …