So erstellen Sie einen leeres Dataframe in R (mit Beispielen)

Von Fabian
Kategorie: R
Tags: Operationen
Lesezeit: 2 Minuten

Es gibt zwei grundlegende Möglichkeiten, um einen leeren Dataframe in R zu erstellen:

Methode 1: Matrix mit Spaltennamen

# Dataframe mit 0 Zeilen und 3 Spalten erstellen
df <- data.frame(matrix(ncol = 3, nrow = 0))

# Spaltennamen bereitstellen
colnames(df) <- c('var1', 'var2', 'var3')

Methode 2: Leere Vektoren initialisieren

# Dataframe mit 5 leeren Vektoren erstellen
df2 <- data.frame(Doubles=double(),
                 Integers=integer(),
                 Factors=factor(),
                 Logicals=logical(),
                 Characters=character(),
                 stringsAsFactors=FALSE)

Dieses Tutorial zeigt Beispiele für die praktische Anwendung dieser beiden Methoden.

Methode 1: Matrix mit Spaltennamen

Die erste Möglichkeit, ein leeres Dataframe zu erstellen, besteht in den folgenden Schritten:

  • Definieren Sie eine Matrix mit 0 Zeilen und beliebig vielen Spalten.
  • Verwenden Sie dann die Funktion data.frame(), um es in ein Dataframe zu konvertieren, und die Funktion colnames(), um ihm Spaltennamen zu geben.
  • Verwenden Sie dann die Funktion str(), um die Struktur des resultierenden Dataframes zu analysieren.

Zum Beispiel:

# Dataframe mit 0 Zeilen und 5 Spalten erstellen
df <- data.frame(matrix(ncol = 5, nrow = 0))

# Spaltennamen bereitstellen
colnames(df) <- c('var1', 'var2', 'var3', 'var4', 'var5')

# Struktur des Dataframes anzeigen
str(df)

'data.frame':   0 obs. of  5 variables:
 $ var1: logi 
 $ var2: logi 
 $ var3: logi 
 $ var4: logi 
 $ var5: logi 

Wir können sehen, dass der resultierende Dataframe 0 Beobachtungen (d.h. Zeilen), 5 Variablen (d.h. Spalten) enthält und jede der Variablen der Klasse logi angehört.

Obwohl jede Variable der Klasse logi angehört, können Sie den Variablen unterschiedlicher Typen dennoch Zeilen hinzufügen.

Methode 2: Leere Vektoren initialisieren

Die zweite Möglichkeit, ein leeres Dataframe zu erstellen, besteht in den folgenden Schritten:

  • Definieren Sie ein Dataframe als eine Menge leerer Vektoren mit bestimmten Klassentypen.
  • Geben Sie stringsAsFactors = False an, damit alle Zeichenvektoren als Zeichenfolgen und nicht als Faktoren behandelt werden.

Zum Beispiel:

# Dataframe mit 5 leeren Vektoren erstellen
df2 <- data.frame(Doubles=double(),
                  Integers=integer(),
                  Factors=factor(),
                  Logicals=logical(),
                  Characters=character(),
                  stringsAsFactors=FALSE)

# Ansichtsstruktur des Dataframes
str(df2)

'data.frame':   0 obs. of  5 variables:
 $ Doubles  : num 
 $ Integers : int 
 $ Factors  : Factor w/ 0 levels: 
 $ Logicals : logi 
 $ Characters: chr  

Wir können sehen, dass der resultierende Dataframe 0 Beobachtungen (d.h. Zeilen), 5 Variablen (d.h. Spalten) enthält und jede der Variablen fünf verschiedene Klassen sind.

Beachten Sie, dass wir in nur einem Schritt auch Spaltennamen für das Dataframe bereitstellen konnten (z.B. lautet der erste Spaltenname "Doubles", der zweite Spaltenname "Integers" usw.).

Zusätzliche Ressourcen

So durchlaufen Sie Spaltennamen in R
So hängen Sie Zeilen an ein Dataframe in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: