Was ist eine bimodale Verteilung?

Von Fabian
Kategorie: Tutorials
Lesezeit: 3 Minuten

Eine bimodale Verteilung ist eine Wahrscheinlichkeitsverteilung mit zwei Modi.

In beschreibenden Statistiken wird häufig der Begriff „Modus“ verwendet, um auf den am häufigsten vorkommenden Wert in einem Datensatz zu verweisen. In diesem Fall bezieht sich der Begriff „Modus“ jedoch auf ein lokales Maximum in einem Diagramm.

Wenn Sie eine bimodale Verteilung visualisieren, werden Sie zwei unterschiedliche „Peaks“ bemerken, die diese beiden Modi darstellen.

Bimodale Verteilung

Dies unterscheidet sich von einer unimodalen Verteilung mit nur einem Peak:

Unimodale Verteilung

Sie können sich an den Unterschied zwischen den beiden erinnern, indem Sie sich erinnern:

  • „Bi“ = zwei
  • „Uni“ = eins

Obwohl die meisten Statistikkurse unimodale Verteilungen wie die Normalverteilung verwenden, um verschiedene Themen zu erklären, werden bimodale Verteilungen in der Praxis tatsächlich ziemlich häufig angezeigt, sodass es nützlich ist, zu wissen, wie man sie erkennt und interpretiert.

Beispiele für bimodale Verteilungen

Hier einige Beispiele für bimodale Verteilungen:

Beispiel 1: Spitzenzeiten im Restaurant

Wenn Sie ein Diagramm erstellt haben, um die Verteilung der Kunden in einem bestimmten Restaurant nach Stunden zu visualisieren, werden Sie wahrscheinlich feststellen, dass es einer bimodalen Verteilung mit einem Peak während der Mittagspause und einem weiteren Peak während der Abendstunden folgt:

Beispiel einer bimodalen Verteilung

Beispiel 2: Durchschnittliche Höhe von zwei Pflanzenarten

Angenommen, Sie haben ein Feld umrundet und die Höhe verschiedener Pflanzen gemessen. Ohne es zu merken, messen Sie die Höhe von zwei verschiedenen Arten – eine, die ziemlich groß und eine, die ziemlich kurz ist. Wenn Sie ein Diagramm erstellen, um die Höhenverteilung zu visualisieren, folgt es einer bimodalen Verteilung:

Beispiel für eine bimodale Verteilung

Beispiel 3: Prüfungsergebnisse

Angenommen, ein Lehrer gibt seiner Schülerklasse eine Prüfung. Einige der Studenten haben für die Prüfung studiert, andere nicht. Wenn der Lehrer ein Diagramm der Prüfungsergebnisse erstellt, folgt eine bimodale Verteilung mit einem Peak um niedrige Ergebnisse für Schüler, die nicht studiert haben, und einem weiteren Peak um hohe Ergebnisse für Schüler, die nicht studiert haben:

Beispiel einer bimodalen Verteilung mit Prüfungsergebnissen

Was verursacht bimodale Verteilungen?

Es gibt normalerweise zwei Dinge, die bimodale Verteilungen verursachen:

1. Ein zugrunde liegendes Phänomene.

Oft treten bimodale Verteilungen aufgrund eines zugrundes liegendes Phänomen auf.

Zum Beispiel folgt die Anzahl der Kunden, die stündlich ein Restaurant besuchen, einer bimodalen Verteilung, da die Leute dazu neigen, zu zwei unterschiedlichen Zeiten auswärts zu essen: Mittag- und Abendessen. Dieses zugrunde liegende menschliche Verhalten verursacht die bimodale Verteilung.

2. Zwei verschiedene Gruppen werden zusammengefasst.

Bimodale Verteilungen können auch auftreten, wenn Sie einfach zwei verschiedene Gruppen von Dingen analysieren, ohne es zu merken.

Wenn Sie beispielsweise die Höhe von Pflanzen in einem bestimmten Feld messen, ohne zu bemerken, dass zwei verschiedene Arten auf demselben Feld wachsen, wird beim Erstellen eines Diagramms eine bimodale Verteilung angezeigt.

So analysieren Sie bimodale Verteilungen

Wir beschreiben Verteilungen oft mit dem Mittelwert oder Median, da dies uns eine Vorstellung davon gibt, wo sich das „Zentrum“ der Verteilung befindet.

Leider sind der Mittelwert und der Median für eine bimodale Verteilung nicht nützlich. Zum Beispiel beträgt die durchschnittliche Prüfungspunktzahl für Schüler im obigen Beispiel 81:

Bimodale Verteilung

Allerdings haben nur sehr wenige Schüler tatsächlich fast 81 Punkte erzielt. In diesem Fall ist der Mittelwert irreführend. Die meisten Schüler erzielten tatsächlich 74 oder 88 Punkte.

Eine bessere Möglichkeit, bimodale Verteilungen zu analysieren und zu interpretieren, besteht darin, die Daten einfach in zwei separate Gruppen aufzuteilen und dann das Zentrum und die Streuung für jede Gruppe zu analysieren.

Zum Beispiel können wir die Prüfungsergebnisse in „niedrige Ergebnisse“ und „hohe Ergebnisse“ aufteilen und dann den Mittelwert und die Standardabweichung für jede Gruppe ermitteln.

Wenn Sie die Ergebnisse einiger Analysen teilen und Ihre Daten einer bimodalen Verteilung folgen, ist es hilfreich, ein Histogramm wie das oben gezeigte zu erstellen, damit Ihr Publikum klar erkennen kann, dass die Verteilung zwei unterschiedliche „Peaks“ aufweist und nur diese Es ist sinnvoll, jeden Peak einzeln und nicht als einen großen Datensatz zu analysieren.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: