So erstellen Sie gruppierte Boxplots in R mit ggplot2

Von Fabian
Kategorie: R
Tags: ggplot2
Lesezeit: 2 Minuten

Boxplots sind nützlich, um die fünfstellige Zusammenfassung eines Datensatzes zu visualisieren. Dazu gehören:

  • Das Minimum
  • Das erste Quartil
  • Der Median
  • Das dritte Quartil
  • Das Maximum

Verwandt: Eine sanfte Einführung in Boxplots

Glücklicherweise ist es einfach, Boxplots in R mit der Visualisierungsbibliothek ggplot2 zu erstellen.

Es dient auch zum Erstellen von Boxplots, die nach einer bestimmten Variablen in einem Dataset gruppiert sind. Angenommen, wir haben den folgenden Datensatz, der die Effizienzsteigerung für 150 Basketballspieler in drei verschiedenen Teams basierend auf zwei verschiedenen Trainingsprogrammen anzeigt:

# Variablen definieren
team=rep(c('A', 'B', 'C'), each=50)
program=rep(c('low', 'high'), each=25)
increase=seq(1:150)+sample(1:100, 100, replace=TRUE)

# Datensatz mit Variablen erstellen
data=data.frame(team, program, increase)

# Die ersten sechs Zeilen des Datensatzes anzeigen 
head(data)

  team program increase
1    A     low       62
2    A     low       37
3    A     low       49
4    A     low       60
5    A     low       64
6    A     low      105

Wir können den folgenden Code verwenden, um Boxplots zu erstellen, die die Effizienzsteigerung für Spieler anzeigen, nach Team gruppiert und basierend auf dem Trainingsprogramm ausgefüllt werden:

library(ggplot2)

ggplot(data, aes(x=team, y=increase, fill=program)) + 
  geom_boxplot()

Gruppiertes Boxplot in R

Wir können eine ähnliche Syntax verwenden, um Boxplots zu erstellen, die die Effizienzsteigerung für Spieler anzeigen, nach Trainingsprogrammen gruppiert und je nach Team ausgefüllt werden:

library(ggplot2)

ggplot(data, aes(x=program, y=increase, fill=team)) + 
  geom_boxplot()

Gruppiertes Boxplot in R

Eine ähnliche Alternative ist die Verwendung von Facettierung, bei der jede Untergruppe in einem eigenen Bereich angezeigt wird:

library(ggplot2)

ggplot(data, aes(x=team, y=increase, fill=program)) + 
  geom_boxplot() +
  facet_wrap(~program)

Boxplots in R gruppiert nach Facetten

Abhängig von den Daten, mit denen Sie arbeiten, kann das Facettieren für Ihre Visualisierungsanforderungen sinnvoll sein oder auch nicht.

Zusätzliche Ressourcen

Erstellen von Side-by-Side-Plots in ggplot2
Eine vollständige Anleitung zu den besten ggplot2-Themen

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: