Oft möchten Sie eine oder mehrere Spalten in einem Dataframe in R umbenennen. Glücklicherweise ist dies mit der Funktion rename() aus dem dplyr-Paket einfach zu bewerkstelligen.
library(dplyr)
Dieses …
Oft möchten Sie möglicherweise die Anzahl der Beobachtungen (oder Zeilen) nach Gruppen in R zählen. Glücklicherweise ist dies mit der Funktion count() aus der dplyr-Bibliothek einfach zu bewerkstelligen.
library(dplyr)
In diesem Tutorial werden einige Beispiele für die praktische Verwendung dieser Funktion anhand des folgenden Dataframes erläutert:
# Dataframe erstellen
df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C'),
position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F'),
points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))
#Dataframe anzeigen
df
team position points
1 A G 4
2 A G 13
3 A F 7
4 B G 8
5 B F 15
6 B F 15
7 B F 17
8 B G 9
9 C G 21
10 C F 22
11 C F 25
12 C F 31
Der folgende Code zeigt, wie die Gesamtzahl der Spieler pro Team gezählt wird:
#Zahl der Gesamtbeobachtungen nach Variable 'Team'
df %>% count(team)
# A tibble: 3 x 2
team n
1 A 3
2 B 5
3 C 4
Aus der Ausgabe können wir Folgendes ersehen:
Diese einzelne count()-Funktion gibt uns eine gute Vorstellung von der Verteilung der Spieler nach Team.
Beachten Sie, dass wir die Zählungen auch sortieren können, wenn wir möchten:
#Zahl der Gesamtbeobachtungen nach Variable 'Team'
df %>% count(team, sort=TRUE)
# A tibble: 3 x 2
team n
1 B 5
2 C 4
3 A 3
Wir können auch nach mehr als einer Variablen sortieren:
#Zählen Sie die Gesamtbeobachtungen nach "Team" und "Position".
df %>% count(team, position)
# A tibble: 6 x 3
team position n
1 A F 1
2 A G 2
3 B F 3
4 B G 2
5 C F 3
6 C G 1
Aus der Ausgabe können wir Folgendes ersehen:
Wir können auch die Anzahl einer Variablen durch eine andere Variable „gewichten“. Der folgende Code zeigt beispielsweise, wie die Gesamtbeobachtungen pro Team unter Verwendung der Variablen "Punkte" als Gewicht gezählt werden:
df %>% count(team, wt=points)
# A tibble: 3 x 2
team n
1 A 24
2 B 64
3 C 99
Die vollständige Dokumentation zur Funktion count() finden Sie hier.
Oft möchten Sie vielleicht den Maximalwert jeder Gruppe in einem Dataframe in R finden. Praktischerweise ist dies mit Funktionen aus dem dplyr-Paket einfach zu bewerkstelligen.
In diesem Tutorial wird …