Ein Paretodiagramm ist eine Art von Diagramm, das die Häufigkeiten verschiedener Kategorien zusammen mit den kumulativen Häufigkeiten der Kategorien anzeigt.

Paretodiagramm in R

Dieses Tutorial zeigt Schritt für Schritt, wie man ein Paretodiagramm in R erstellt.

Schritt 1: Erstellen der Daten

Angenommen, wir führen eine Umfrage durch, in der wir 350 verschiedene Personen bitten, ihre Lieblingsmüslimarke zwischen den Marken A, B, C, D und E zu wählen.

Der folgende Datensatz zeigt die Gesamtstimmen für jede Marke:

#Daten erstellen
df <- data.frame(favorite=c('A', 'B', 'C', 'D', 'E', 'F'),
                 count=c(140, 97, 58, 32, 17, 6))

#Daten anzeigen
df

  favorite count
1        A   140
2        B    97
3        C    58
4        D    32
5        E    17
6        F     6

Schritt 2: Erstellen des Paretodiagramms

Um ein Paretodiagramm zur Visualisierung der Ergebnisse dieser Umfrage zu erstellen, können wir die Funktion pareto.chart() aus dem Paket qcc verwenden:

library(qcc)

#Paretodiagramm erstellen
pareto.chart(df$count)

Pareto chart analysis for df$count
     Frequency  Cum.Freq. Percentage Cum.Percent.
  A 140.000000 140.000000  40.000000    40.000000
  B  97.000000 237.000000  27.714286    67.714286
  C  58.000000 295.000000  16.571429    84.285714
  D  32.000000 327.000000   9.142857    93.428571
  E  17.000000 344.000000   4.857143    98.285714
  F   6.000000 350.000000   1.714286   100.000000

Paretor

Die Tabelle in der Ausgabe zeigt uns die Häufigkeit und kumulative Häufigkeit jeder Marke. Zum Beispiel:

  • Häufigkeit der Marke A: 140 | Kumulative Häufigkeit: 140
  • Häufigkeit von Marke B: 97 | Kumulierte Häufigkeit von A, B: 237
  • Häufigkeit von Marke C: 58 | Kumulierte Häufigkeit von A, B, C: 295

Und so weiter.

Schritt 3: Ändern Sie das Paretodiagramm (optional)

Der folgende Code zeigt, wie der Titel des Diagramms zusammen mit der verwendeten Farbpalette geändert werden kann:

pareto.chart(df$count,
             main='Pareto Chart for Favorite Cereal Brands',
             col=heat.colors(length(df$count)))

Paretodiagramm in R

Eine vollständige Liste der verfügbaren Farbpaletten finden Sie in diesem R Farben Cheat Sheet.

Zusätzliche Ressourcen

Anleitung zur Erstellung von Häufigkeitstabellen in R
Erstellung eines relativen Häufigkeitshistogramms in R
Berechnung von kumulativen Summen in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: