In der Statistik sind Quantile Werte, die ein geordnetes Dataset in gleiche Gruppen unterteilen.

Um die nach einer bestimmten Variablen gruppierten Quantile in R zu berechnen, können wir die folgenden Funktionen aus dem dplyr-Paket in R verwenden:

library(dplyr)

#Interessante Quantile definieren
q = c(.25, .5, .75)

#Quantile durch Gruppieren von Variablen berechnen
df %>%
  group_by(grouping_variable) %>%
  summarize(quant25 = quantile(numeric_variable, probs = q[1]), 
            quant50 = quantile(numeric_variable, probs = q[2]),
            quant75 = quantile(numeric_variable, probs = q[3]))

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden.

Beispiele: Quantile nach Gruppe in R

Der folgende Code zeigt, wie die Quantile für die Anzahl der nach Team gruppierten Siege für einen Datensatz in R berechnet werden:

library(dplyr)

#Daten erstellen
df <- data.frame(team=c('A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                        'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B',
                        'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C'),
                 wins=c(2, 4, 4, 5, 7, 9, 13, 13, 15, 15, 14, 13,
                        11, 9, 9, 8, 8, 16, 19, 21, 24, 20, 19, 18))

#die ersten sechs Datenzeilen anzeigen
head(df)

  team wins
1    A    2
2    A    4
3    A    4
4    A    5
5    A    7
6    A    9

#Interessante Quantile definieren
q = c(.25, .5, .75)

#Quantile durch Gruppieren von Variablen berechnen
df %>%
  group_by(team) %>%
  summarize(quant25 = quantile(wins, probs = q[1]), 
            quant50 = quantile(wins, probs = q[2]),
            quant75 = quantile(wins, probs = q[3]))

  team  quant25  quant50  quant75           
1 A         4         6     10  
2 B         9        12     14.2
3 C        17.5      19     20.2

Beachten Sie, dass wir auch eine beliebige Anzahl von Quantilen angeben können, die wir möchten:

#Interessante Quantile definieren
q = c(.2, .4, .6, .8)

#Quantile durch Gruppieren von Variablen berechnen
df %>%
  group_by(team) %>%
  summarize(quant20 = quantile(wins, probs = q[1]), 
            quant40 = quantile(wins, probs = q[2]),
            quant60 = quantile(wins, probs = q[3]),
            quant80 = quantile(wins, probs = q[4]))

  team  quant20 quant40 quant60 quant80

1 A         4       4.8     7.4    11.4
2 B         9      10.6    13.2    14.6
3 C        16.8    18.8    19.2    20.6

Wir können auch nur ein Quantil pro Gruppe berechnen. So berechnen Sie beispielsweise das 90. Perzentil der Anzahl der Siege für jedes Team:

#90. Perzentil der Siege nach Team berechnen
df %>%
  group_by(team) %>%
  summarize(quant90 = quantile(wins, probs = 0.9))

   team   quant90

1  A        13  
2  B        15  
3  C        21.9

Zusätzliche Ressourcen

Wie man Quartile in R berechnet
So berechnen Sie Dezile in R
So berechnen Sie Perzentile in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: