Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Ein Paretodiagramm ist eine Art von Diagramm, das die Häufigkeiten verschiedener Kategorien zusammen mit den kumulativen Häufigkeiten der Kategorien anzeigt.
Dieses Tutorial zeigt Schritt für Schritt, wie man ein Paretodiagramm in R erstellt.
Angenommen, wir führen eine Umfrage durch, in der wir 350 verschiedene Personen bitten, ihre Lieblingsmüslimarke zwischen den Marken A, B, C, D und E zu wählen.
Der folgende Datensatz zeigt die Gesamtstimmen für jede Marke:
#Daten erstellen
df <- data.frame(favorite=c('A', 'B', 'C', 'D', 'E', 'F'),
count=c(140, 97, 58, 32, 17, 6))
#Daten anzeigen
df
favorite count
1 A 140
2 B 97
3 C 58
4 D 32
5 E 17
6 F 6
Um ein Paretodiagramm zur Visualisierung der Ergebnisse dieser Umfrage zu erstellen, können wir die Funktion pareto.chart() aus dem Paket qcc verwenden:
library(qcc)
#Paretodiagramm erstellen
pareto.chart(df$count)
Pareto chart analysis for df$count
Frequency Cum.Freq. Percentage Cum.Percent.
A 140.000000 140.000000 40.000000 40.000000
B 97.000000 237.000000 27.714286 67.714286
C 58.000000 295.000000 16.571429 84.285714
D 32.000000 327.000000 9.142857 93.428571
E 17.000000 344.000000 4.857143 98.285714
F 6.000000 350.000000 1.714286 100.000000
Die Tabelle in der Ausgabe zeigt uns die Häufigkeit und kumulative Häufigkeit jeder Marke. Zum Beispiel:
Und so weiter.
Der folgende Code zeigt, wie der Titel des Diagramms zusammen mit der verwendeten Farbpalette geändert werden kann:
pareto.chart(df$count,
main='Pareto Chart for Favorite Cereal Brands',
col=heat.colors(length(df$count)))
Eine vollständige Liste der verfügbaren Farbpaletten finden Sie in diesem R Farben Cheat Sheet.
Anleitung zur Erstellung von Häufigkeitstabellen in R
Erstellung eines relativen Häufigkeitshistogramms in R
Berechnung von kumulativen Summen in R
Ein Log-Log-Diagramm ist ein Diagramm, das sowohl auf der x-Achse als auch auf der y-Achse logarithmische Skalen verwendet.
Diese Art von Diagramm ist nützlich, um zwei Variablen zu visualisieren, wenn …
Bei der Verwendung von Klassifizierungsmodellen beim maschinellen Lernen verwenden wir häufig zwei Metriken, um die Qualität des Modells zu bewerten, nämlich Präzision und Erinnerung.
Precision: Korrigieren Sie positive Vorhersagen im …