So zeichnen Sie mehrere Boxplots in einem Diagramm in R

Von Fabian
Kategorie: R
Lesezeit: 2 Minuten

Ein Boxplot (manchmal auch als Box-and-Whisker-Plot bezeichnet) ist ein Plot, der die fünfstellige Zusammenfassung eines Datensatzes zeigt. Die Zusammenfassung mit fünf Zahlen ist das Minimum, das erste Quartil, der Median, das dritte Quartil und das Maximum. Wir können ein Boxplot verwenden, um einen Datensatz in einem einfachen Plot einfach zu visualisieren.

In diesem Tutorial wird erklärt, wie Sie mehrere Boxplots in einem Plot in R unter Verwendung von Base R und ggplot2 zeichnen.

Boxplots in Base R

Um zu veranschaulichen, wie Boxplots in Basis R erstellt werden, arbeiten wir mit dem integrierten Luftqualitätsdatensatz in R:

# Die ersten 6 Zeilen des Datensatzes "Luftqualität" anzeigen
head(airquality)

# Ozone Solar.R Wind Temp Month Day

#1 41   190     7.4   67   5     1
#2 36   118     8.0   72   5     2
#3 12   149     12.6  74   5     3
#4 18   313     11.5  62   5     4
#5 NA   NA      14.3  56   5     5
#6 28   NA      14.9  66   5     6

Um ein einzelnes Boxplot für die Variable „Ozone“ zu erstellen, können wir die folgende Syntax verwenden:

# Boxplot für die Variable "Ozone" erstellen
boxplot(airquality$Ozone)

Dies erzeugt das folgende Boxplot:

Boxplot

Angenommen, wir möchten stattdessen ein Boxplot für jeden Monat im Datensatz generieren. Die folgende Syntax zeigt, wie das geht:

#Erstellen Sie ein Boxplot, in dem die Temperaturverteilung für jeden Monat im Datensatz angezeigt wird
boxplot(Temp~Month,
       data=airquality,
       main="Temperature Distribution by Month",
       xlab="Month",
       ylab="Degrees (F)",
       col="steelblue",
       border="black"
)

Dadurch wird das folgende Diagramm generiert, in dem für jeden Monat ein Boxplot angezeigt wird:

Boxplot 2

Boxplots in ggplot2

Eine andere Möglichkeit, Boxplots in R zu erstellen, ist die Verwendung des Pakets ggplot2. In den folgenden Beispielen wird die integrierte Datensatz- airquality erneut verwendet.

Um ein einzelnes Boxplot für die Variable „Ozone“ im Luftqualitätsdatensatz zu erstellen, können Sie die folgende Syntax verwenden:

#Boxplot für die Variable "Ozone" erstellen
library(ggplot2)
ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()

Dies erzeugt das folgende Boxplot:

Boxplot in R

Wenn wir stattdessen ein Boxplot für jeden Monat im Datensatz generieren möchten, können wir dazu die folgende Syntax verwenden:

#Erstellen Sie ein Boxplot, in dem die Temperaturverteilung für jeden Monat im Datensatz angezeigt wird
library(ggplot2)
ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
       geom_boxplot(fill="steelblue") +
       labs(title="Temperature Distribution by Month", ="Month", y="Degrees (F)")

Dadurch wird das folgende Diagramm generiert, in dem ein Boxplot für jeden Monat angezeigt wird:

Boxplot mit ggplot2 in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: