Oft möchten Sie möglicherweise die Anzahl der Beobachtungen (oder Zeilen) nach Gruppen in R zählen. Glücklicherweise ist dies mit der Funktion count() aus der dplyr-Bibliothek einfach zu bewerkstelligen.
library …Oft sind Sie daran interessiert, die Zeilen eines Dataframes in R in einer bestimmten Reihenfolge anzuordnen. Glücklicherweise ist dies mit der Funktion arrange() aus der dplyr-Bibliothek einfach zu bewerkstelligen.
In diesem Tutorial werden einige Beispiele für die praktische Verwendung dieser Funktion anhand des folgenden Dataframes erläutert:
# Dataframe erstellen
df <- data.frame(player = c('A', 'B', 'C', 'D', 'E', 'F', 'G'),
                 points = c(12, 14, 14, 15, 20, 18, 29),
                 assists = c(3, 5, 7, 8, 14, NA, 9))
#Dataframe anzeigen 
df
  player points assists
1      A     12       3
2      B     14       5
3      C     14       7
4      D     15       8
5      E     20      14
6      F     18      NA
7      G     29       9
Der folgende Code zeigt, wie der Dataframe in aufsteigender Reihenfolge basierend auf den Werten in der Spalte "Punkte" angeordnet wird:
library(dplyr)
df %>% arrange(points)
  player points assists
1      A     12       3
2      B     14       5
3      C     14       7
4      D     15       8
5      F     18      NA
6      E     20      14
7      G     29       9
Um in absteigender Reihenfolge zu sortieren, können wir die Funktion desc() verwenden:
df %>% arrange(desc(points))
  player points assists
1      G     29       9
2      E     20      14
3      F     18      NA
4      D     15       8
5      B     14       5
6      C     14       5
7      A     12       3
Beachten Sie, dass NAs bis zum Ende sortiert werden, unabhängig davon, ob Sie aufsteigend oder absteigend sortieren:
df %>% arrange(assists)
  player points assists
1      A     12       3
2      B     14       5
3      C     14       7
4      D     15       8
5      G     29       9
6      E     20      14
7      F     18      NA
df %>% arrange(desc(assists))
  player points assists
1      E     20      14
2      G     29       9
3      D     15       8
4      C     14       7
5      B     14       5
6      A     12       3
7      F     18      NA
Um die Zeilen nach mehreren Spalten anzuordnen, können Sie einfach weitere Spaltennamen als Argumente angeben:
df %>% arrange(points, assists)
  player points assists
1      A     12       3
2      B     14       5
3      C     14       7
4      D     15       8
5      F     18      NA
6      E     20      14
7      G     29       9
Wir können die Zeilen auch nach einer Spalte aufsteigend und einer anderen absteigend anordnen:
df %>% arrange(points, desc(assists))
  player points assists
1      A     12       3
2      C     14       7
3      B     14       5
4      D     15       8
5      F     18      NA
6      E     20      14
7      G     29       9
Gelegentlich möchten Sie die Zeilen möglicherweise auch in einer benutzerdefinierten Reihenfolge sortieren. Sie können dies einfach tun, indem Sie einen Faktor mit bestimmten Ebenen verwenden:
# Nach Spieler sortieren mit eigener Anordnung
df %>% arrange(factor(player, levels = c('D', 'C', 'A', 'B', 'E', 'F', 'G')))
  player points assists
1      D     15       8
2      C     14       7
3      A     12       3
4      B     14       5
5      E     20      14
6      F     18      NA
7      G     29       9
Die vollständige Dokumentation zur Funktion arrange() finden Sie hier.
Oft möchten Sie möglicherweise die Anzahl der Beobachtungen (oder Zeilen) nach Gruppen in R zählen. Glücklicherweise ist dies mit der Funktion count() aus der dplyr-Bibliothek einfach zu bewerkstelligen.
library …