Wie man Beobachtungen nach Gruppen in R zählt

Von Fabian
Kategorie: R
Tags: dplyr
Lesezeit: 3 Minuten

Oft möchten Sie möglicherweise die Anzahl der Beobachtungen (oder Zeilen) nach Gruppen in R zählen. Glücklicherweise ist dies mit der Funktion count() aus der dplyr-Bibliothek einfach zu bewerkstelligen.

library(dplyr)

In diesem Tutorial werden einige Beispiele für die praktische Verwendung dieser Funktion anhand des folgenden Dataframes erläutert:

# Dataframe erstellen
df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C'),
                 position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F'),
                 points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#Dataframe anzeigen
df

   team position points
1     A        G      4
2     A        G     13
3     A        F      7
4     B        G      8
5     B        F     15
6     B        F     15
7     B        F     17
8     B        G      9
9     C        G     21
10    C        F     22
11    C        F     25
12    C        F     31

Beispiel 1: Zählen um eine Variable

Der folgende Code zeigt, wie die Gesamtzahl der Spieler pro Team gezählt wird:

#Zahl der Gesamtbeobachtungen nach Variable 'Team'
df %>% count(team)

# A tibble: 3 x 2
  team      n

1 A         3
2 B         5
3 C         4

Aus der Ausgabe können wir Folgendes ersehen:

  • Team A hat 3 Spieler
  • Team B hat 5 Spieler
  • Team C hat 4 Spieler

Diese einzelne count()-Funktion gibt uns eine gute Vorstellung von der Verteilung der Spieler nach Team.

Beachten Sie, dass wir die Zählungen auch sortieren können, wenn wir möchten:

#Zahl der Gesamtbeobachtungen nach Variable 'Team'
df %>% count(team, sort=TRUE)

# A tibble: 3 x 2
  team      n

1 B         5
2 C         4
3 A         3

Beispiel 2: Zählen nach mehreren Variablen

Wir können auch nach mehr als einer Variablen sortieren:

#Zählen Sie die Gesamtbeobachtungen nach "Team" und "Position".
df %>% count(team, position)

# A tibble: 6 x 3
  team  position     n

1 A     F            1
2 A     G            2
3 B     F            3
4 B     G            2
5 C     F            3
6 C     G            1

Aus der Ausgabe können wir Folgendes ersehen:

  • Team A hat 1 Spieler auf der Position 'F' (vorwärts) und 2 Spieler auf der Position 'G' (Wache).
  • Team B hat 3 Spieler auf der Position 'F' (vorwärts) und 2 Spieler auf der Position 'G' (Wache).
  • Team C hat 3 Spieler auf der Position 'F' (vorwärts) und 1 Spieler auf der Position 'G' (Wache).

Beispiel 3: Gewichtete Anzahl

Wir können auch die Anzahl einer Variablen durch eine andere Variable „gewichten“. Der folgende Code zeigt beispielsweise, wie die Gesamtbeobachtungen pro Team unter Verwendung der Variablen "Punkte" als Gewicht gezählt werden:

df %>% count(team, wt=points)

# A tibble: 3 x 2
  team      n

1 A        24
2 B        64
3 C        99

Die vollständige Dokumentation zur Funktion count() finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: