So erstellen Sie ein Streifendiagramm in R

Ein Streifendiagramm ist ein Diagrammtyp, der numerische Daten entlang eines einzelnen Streifens anzeigt. Ähnlich wie bei Boxplots können Sie mithilfe von Streifendiagrammen die Verteilung von Daten visualisieren. Streifendiagramme können eine gute Alternative zu Boxplots sein, wenn die Stichprobengröße klein ist, sodass Sie die einzelnen Datenpunkte sehen können.

In diesem Tutorial wird erklärt, wie Sie mit der integrierten Funktion stripchart() ein Streifendiagramm in R erstellen.

Die Funktion stripchart()

Die grundlegende Syntax zum Erstellen eines Streifendiagramms in R lautet wie folgt:

stripchart(x, method, jitter, main, xlab, ylab, col, pch, vertical, group.names)

x: ein numerischer Vektor oder eine Liste von zu zeichnenden numerischen Vektoren. Dies ist das einzige erforderliche Argument, um ein Diagramm zu erstellen.
method: Die Methode zum Trennen von Punkten mit identischen Werten. Die Standardmethode „Überzeichnen“ bewirkt, dass solche Punkte überzeichnet werden. Es ist jedoch möglich, „Jitter“ anzugeben, um die Punkte zu jittern, oder „Stapeln“, um die Punkte zu stapeln.
jitter: Wenn Methode = „Jitter“ verwendet wird, wird die Menge an Jitter angegeben, die angewendet werden soll.
main: Titel des Diagramms
xlab: Beschriftung der x-Achse
ylab: Beschriftung der y-Achse
col: Farbe der Punkte im Diagramm
pch: Form der Punkte im Diagramm
vertical: Wenn vertikal „WAHR“ ist, wird das Diagramm eher vertikal als standardmäßig horizontal gezeichnet
group.names: Gruppenbeschriftungen, die neben dem Plot gedruckt werden sollen, wenn mehr als ein numerischer Vektor geplottet wird.

Streifendiagramm für einen einzelnen numerischen Vektor

Im folgenden Beispiel wird mithilfe der integrierten R-Dataset- Iris ein Streifendiagramm für einen einzelnen numerischen Vektor erstellt.

#Die ersten sechs Zeilen des Iris- Datensatzes anzeigen
head(iris)

#  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1          5.1         3.5          1.4         0.2  setosa
#2          4.9         3.0          1.4         0.2  setosa
#3          4.7         3.2          1.3         0.2  setosa
#4          4.6         3.1          1.5         0.2  setosa
#5          5.0         3.6          1.4         0.2  setosa
#6          5.4         3.9          1.7         0.4  setosa

Der folgende Code erstellt ein grundlegendes Streifendiagramm für die Variable Sepal.Length:

stripchart(iris$Sepal.Length)

Wir können auch zusätzliche Argumente hinzufügen, um einen Titel und eine Beschriftung der x-Achse hinzuzufügen, die Farbe der Punkte zu ändern, die Form der Punkte zu ändern und die Methode „Jitter“ zu verwenden, damit sich einzelne Punkte nicht überlappen:

stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter')

Anstatt die Punkte zu verwackeln, können wir sie stattdessen „stapeln“:

stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'stack')

Wir können das Diagramm auch vertikal anstelle der Standardhorizontale anzeigen und stattdessen die Achsenbeschriftung so ändern, dass sie auf der y-Achse liegt:

stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           ylab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter',
           vertical = TRUE)

Streifendiagramm für mehrere numerische Vektoren

Wir können auch mehrere Streifendiagramme in einem einzigen Diagramm zeichnen, indem wir eine Liste numerischer Vektoren übergeben.

Der folgende Code erstellt eine Liste, die die Variablen Sepal Length und Sepal Width im iris Dataset enthält, und erstellt ein Streifendiagramm für jede Variable in einem einzelnen Diagramm:

#Liste der Variablen erstellen
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)
#Erstellen Sie ein Diagramm, das ein Streifendiagramm pro Variable enthält
stripchart(x,
           main = 'Sepal Width &amp; Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter')

Wie im vorherigen Beispiel können Sie festlegen, dass die Streifendiagramme vertikal anstelle der Standardhorizontale dargestellt werden:

stripchart(x, main = 'Sepal Width &amp; Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

Zusätzlich können wir eine Formel in Form von y ~ x an die Funktion stripchart() übergeben, wobei y ein numerischer Vektor ist, der durch den Wert von x gruppiert ist.

Zum Beispiel könnten wir im iris Datensatz die Daten nach Species gruppieren, die drei unterschiedliche Werte haben („setosa“, „versicolor“ und „virginica“) und dann die Sepal Length für jede Art in einem Streifendiagramm darstellen:

stripchart(Sepal.Length ~ Species,
           data = iris,
           main = 'Sepal Length by Species',
           xlab = 'Species', 
           ylab = 'Sepal Length',
           col = c('steelblue', 'coral2', 'purple'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

Geben Sie einfach Folgendes ein, um die vollständige Dokumentation zur Funktion stripchart() in R anzuzeigen:

?stripchart

Die Funktion stripchart()

Streifendiagramm für einen einzelnen numerischen Vektor

Streifendiagramm für mehrere numerische Vektoren

Statistik: Der Weg zur Datenanalyse

So erstellen Sie ein Log-Log-Diagramm in Python

So erstellen Sie eine Precision-Recall-Kurve in Python