Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Ein Streifendiagramm ist ein Diagrammtyp, der numerische Daten entlang eines einzelnen Streifens anzeigt. Ähnlich wie bei Boxplots können Sie mithilfe von Streifendiagrammen die Verteilung von Daten visualisieren. Streifendiagramme können eine gute Alternative zu Boxplots sein, wenn die Stichprobengröße klein ist, sodass Sie die einzelnen Datenpunkte sehen können.
In diesem Tutorial wird erklärt, wie Sie mit der integrierten Funktion stripchart() ein Streifendiagramm in R erstellen.
Die grundlegende Syntax zum Erstellen eines Streifendiagramms in R lautet wie folgt:
stripchart(x, method, jitter, main, xlab, ylab, col, pch, vertical, group.names)
Im folgenden Beispiel wird mithilfe der integrierten R-Dataset- Iris ein Streifendiagramm für einen einzelnen numerischen Vektor erstellt.
#Die ersten sechs Zeilen des Iris- Datensatzes anzeigen
head(iris)
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa
Der folgende Code erstellt ein grundlegendes Streifendiagramm für die Variable Sepal.Length:
stripchart(iris$Sepal.Length)
Wir können auch zusätzliche Argumente hinzufügen, um einen Titel und eine Beschriftung der x-Achse hinzuzufügen, die Farbe der Punkte zu ändern, die Form der Punkte zu ändern und die Methode „Jitter“ zu verwenden, damit sich einzelne Punkte nicht überlappen:
stripchart(iris$Sepal.Length,
main = 'Sepal Length Distribution',
xlab = 'Sepal Length',
col = 'red',
pch = 1,
method = 'jitter')
Anstatt die Punkte zu verwackeln, können wir sie stattdessen „stapeln“:
stripchart(iris$Sepal.Length,
main = 'Sepal Length Distribution',
xlab = 'Sepal Length',
col = 'red',
pch = 1,
method = 'stack')
Wir können das Diagramm auch vertikal anstelle der Standardhorizontale anzeigen und stattdessen die Achsenbeschriftung so ändern, dass sie auf der y-Achse liegt:
stripchart(iris$Sepal.Length,
main = 'Sepal Length Distribution',
ylab = 'Sepal Length',
col = 'red',
pch = 1,
method = 'jitter',
vertical = TRUE)
Wir können auch mehrere Streifendiagramme in einem einzigen Diagramm zeichnen, indem wir eine Liste numerischer Vektoren übergeben.
Der folgende Code erstellt eine Liste, die die Variablen Sepal Length und Sepal Width im iris Dataset enthält, und erstellt ein Streifendiagramm für jede Variable in einem einzelnen Diagramm:
#Liste der Variablen erstellen
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)
#Erstellen Sie ein Diagramm, das ein Streifendiagramm pro Variable enthält
stripchart(x,
main = 'Sepal Width & Length Distributions',
xlab = 'Measurement',
ylab = 'Variable',
col = c('steelblue', 'coral2'),
pch = 16,
method = 'jitter')
Wie im vorherigen Beispiel können Sie festlegen, dass die Streifendiagramme vertikal anstelle der Standardhorizontale dargestellt werden:
stripchart(x, main = 'Sepal Width & Length Distributions',
xlab = 'Measurement',
ylab = 'Variable',
col = c('steelblue', 'coral2'),
pch = 16,
method = 'jitter',
vertical = TRUE)
Zusätzlich können wir eine Formel in Form von y ~ x an die Funktion stripchart() übergeben, wobei y ein numerischer Vektor ist, der durch den Wert von x gruppiert ist.
Zum Beispiel könnten wir im iris Datensatz die Daten nach Species gruppieren, die drei unterschiedliche Werte haben („setosa“, „versicolor“ und „virginica“) und dann die Sepal Length für jede Art in einem Streifendiagramm darstellen:
stripchart(Sepal.Length ~ Species,
data = iris,
main = 'Sepal Length by Species',
xlab = 'Species',
ylab = 'Sepal Length',
col = c('steelblue', 'coral2', 'purple'),
pch = 16,
method = 'jitter',
vertical = TRUE)
Geben Sie einfach Folgendes ein, um die vollständige Dokumentation zur Funktion stripchart() in R anzuzeigen:
?stripchart
Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Bei der Verwendung von Klassifizierungsmodellen beim maschinellen Lernen verwenden wir häufig zwei Metriken, um die Qualität des Modells zu bewerten, nämlich Präzision und Erinnerung.
Precision: Korrigieren Sie positive Vorhersagen im …