So verwenden Sie die quantile()-Funktion in R

Von Fabian
Kategorie: R
Lesezeit: 3 Minuten

In der Statistik sind Quantile Werte, die ein geordnetes Dataset in gleiche Gruppen unterteilen.

Die Funktion quantiile() in R kann verwendet werden, um Beispielquantile eines Datensatzes zu berechnen.

Diese Funktion verwendet die folgende grundlegende Syntax:

quantile(x, probs = seq(0, 1, 0.25), na.rm = FALSE)

wo:

  • x: Name des Vektors
  • probs: Numerischer Vektor der Wahrscheinlichkeiten
  • na.rm: Ob NA-Werte entfernt werden sollen

Die folgenden Beispiele zeigen die praktische Anwendung dieser Funktion.

Beispiel 1: Quantile eines Vektors berechnen

Der folgende Code zeigt, wie man Quantile eines Vektors in R berechnet:

#Datenvektor definieren 
data = c(1, 3, 3, 4, 5, 7, 8, 9, 12, 13, 13, 15, 18, 20, 22, 23, 24, 28)

#Quartile berechnen
quantile(data, probs = seq(0, 1, 1/4))

 0%  25%  50%  75% 100% 
1.0  5.5 12.5 19.5 28.0 

#Quintile berechnen
quantile(data, probs = seq(0, 1, 1/5))

 0%  20%  40%  60%  80% 100% 
1.0  4.4  8.8 13.4 21.2 28.0 

#Dezile berechnen
quantile(data, probs = seq(0, 1, 1/10))

 0%  10%  20%  30%  40%  50%  60%  70%  80%  90% 100% 
1.0  3.0  4.4  7.1  8.8 12.5 13.4 17.7 21.2 23.3 28.0 

#Berechnen von zufälligen interessanten Quantilen
quantile(data, probs = c(.2, .5, .9))

20%  50%  90% 
4.4 12.5 23.3

Beispiel 2: Berechnen von Quantilen von Spalten im Dataframe

Der folgende Code zeigt, wie Sie die Quantile einer bestimmten Spalte in einem Dataframe berechnen:

#Dataframe erstellen
df <- data.frame(var1=c(1, 3, 3, 4, 5, 7, 7, 8, 12, 14, 18),
                 var2=c(7, 7, 8, 3, 2, 6, 8, 9, 11, 11, 16),
                 var3=c(3, 3, 6, 6, 8, 4, 4, 7, 10, 10, 11))

#Quartile der Spalte 'var2' berechnen
quantile(df$var2, probs = seq(0, 1, 1/4))

  0%  25%  50%  75% 100% 
 2.0  6.5  8.0 10.0 16.0 

Wir können auch die Funktion sapply() verwenden, um die Quantile mehrerer Spalten gleichzeitig zu berechnen:

#Quartile jeder Spalte berechnen
sapply(df, function(x) quantile(x, probs = seq(0, 1, 1/4)))

     var1 var2 var3
0%    1.0  2.0    3
25%   3.5  6.5    4
50%   7.0  8.0    6
75%  10.0 10.0    9
100% 18.0 16.0   11

Beispiel 3: Quantile nach Gruppe berechnen

Der folgende Code zeigt, wie Sie Funktionen aus dem dplyr- Paket verwenden, um Quantile anhand einer Gruppierungsvariablen zu berechnen:

library(dplyr)

#Dataframe definieren
df <- data.frame(team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C'),
                 points=c(1, 3, 3, 4, 5, 7, 7, 8, 12, 14, 18))

#Definition von interessanten Quantile
q = c(.25, .5, .75)

#Quantile durch Gruppieren von Variablen berechnen
df %>%
  group_by(team) %>%
  summarize(quant25 = quantile(points, probs = q[1]), 
            quant50 = quantile(points, probs = q[2]),
            quant75 = quantile(points, probs = q[3]))

# A tibble: 3 x 4
  team  quant25 quant50 quant75

1 A         2.5       3    3.25
2 B         6.5       7    7.25
3 C          13      14      16   

Zusätzliche Ressourcen

Die folgenden Tutorials zeigen, wie Sie die quantile()-Funktion verwenden, um andere gängige Quantilwerte zu berechnen:

So berechnen Sie Perzentile in R
So berechnen Sie Dezile in R
Wie man Quartile in R . berechnet

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: