Häufigkeitstabelle erstellen in R

Von Fabian
Kategorie: R
Lesezeit: 3 Minuten

Eine Häufigkeitstabelle ist eine Tabelle, in der die Häufigkeiten verschiedener Kategorien angezeigt werden. Diese Art von Tabelle ist besonders nützlich, um die Verteilung von Werten in einem Dataset zu verstehen.

In diesem Tutorial wird erläutert, wie Sie Häufigkeitstabellen in R mithilfe des folgenden Dataframes erstellen:

#Machen Sie dieses Beispiel reproduzierbar
set.seed(0)

#Dataframe erstellen 
df <- data.frame(store=rep(c('A', 'B', 'C'), each=3),
                 sales=round(runif(9, 2, 6), 0),
                 returns=round(runif(9, 1, 3), 0))

#Dataframe anzeigen
df

  store sales returns
1     A     6       2
2     A     3       1
3     A     3       1
4     B     4       1
5     B     6       2
6     B     3       2
7     C     6       3
8     C     6       2
9     C     5       2

Einfaktorielle Häufigkeitstabellen in R

Der folgende Code zeigt, wie eine unidirektionale Häufigkeitstabelle für den variablen Speicher in R erzeugen:

#Häufigkeit jedes Geschäfts berechnen
table(df$store)

A B C 
3 3 3 

Diese Tabelle sagt uns einfach:

  • Speicher A wird dreimal im Dataframe angezeigt.
  • Speicher B erscheint dreimal im Dataframe.
  • Speicher C wird dreimal im Dataframe angezeigt.

Zweifaktorielle Häufigkeitstabellen in R

Der folgende Code zeigt, wie in R eine Zwei-Wege-Häufigkeitstabelle für die Variablen store und sales erstellt wird :

#Zweiwege-Häufigkeitstabelle berechnen
table(df$store, df$sales)

    3 4 5 6
  A 2 0 0 1
  B 1 1 0 1
  C 0 0 1 2 

Diese Tabelle sagt uns:

  • Geschäft A machte 3 Verkäufe bei 2 verschiedenen Gelegenheiten.
  • Geschäft A machte 4 Verkäufe bei 0 Gelegenheiten.
  • Geschäft A machte 5 Verkäufe bei 0 Gelegenheiten.
  • Store A hat 1 Verkauf bei 1 Gelegenheit gemacht.

Usw.

Dreiwege-Häufigkeitstabellen in R

Der folgende Code zeigt, wie Sie eine Drei-Wege-Häufigkeitstabelle für alle drei Variablen in unserem Dataframe erstellen:

#Drei-Wege-Häufigkeitstabelle berechnen
table(df$store, df$sales, df$returns)

, ,  = 1


    3 4 5 6
  A 2 0 0 0
  B 0 1 0 0
  C 0 0 0 0

, ,  = 2


    3 4 5 6
  A 0 0 0 1
  B 1 0 0 1
  C 0 0 1 1

, ,  = 3


    3 4 5 6
  A 0 0 0 0
  B 0 0 0 0
  C 0 0 0 1  

In der ersten Tabelle sind die Gesamtverkäufe nach Filialen angegeben, wenn die Anzahl der Retouren gleich 1 war In der zweiten Tabelle sind die Gesamtverkäufe nach Filialen angegeben, wenn die Anzahl der Retouren gleich 2 war In der dritten Tabelle sind die Gesamtverkäufe nach angegeben speichern, wenn die Anzahl der Retouren gleich 3 war.

Beachten Sie, dass R Häufigkeitstabellen für noch höhere Dimensionen erstellen kann (z. B. 4-Wege-Häufigkeitstabellen, 5-Wege-Häufigkeitstabellen), aber die Ausgabe für höhere Dimensionen ziemlich groß werden kann.

In der Praxis werden am häufigsten einfaktorielle und Zweiweg-Häufigkeitstabellen verwendet.

Zusätzliche Ressourcen

So erstellen Sie Tabellen in R
So führen Sie einen Chi-Quadrat-Unabhängigkeitstest in R durch
So führen Sie einen Chi-Quadrat-Anpassungstest in R durch

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: