Sie können die Funktion read.delim() verwenden, um Textdateien mit Trennzeichen in R einzulesen.
Diese Funktion verwendet die folgende grundlegende Syntax:
read.delim(file, header=TRUE, sep='\t')
wo:
- file …
Angenommen, ich habe eine CSV-Datei namens data.csv am folgenden Speicherort gespeichert:
C:\Benutzer\Bob\Desktop\data.csv
Angenommen, die CSV-Datei enthält die folgenden Daten:
team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14
Es gibt drei Möglichkeiten, diese CSV-Datei in R zu importieren:
1. Verwenden Sie read.csv direkt von R (langsamste Methode, funktioniert aber gut für kleinere Datensätze)
data1 <- read.csv ("C:\\Benutzer\\Bob\\Desktop\\data.csv", header = TRUE, stringsAsFactors = FALSE)
2. Verwenden Sie read_csv aus dem readr-Paket (2-3x schneller als read.csv).
library(readr)
data2 <- read_csv ("C:\\Benutzer\\Bob\\Desktop\\data.csv")
3. Verwenden Sie fread aus dem data.table-Paket (2-3x schneller als read_r).
library (data.table)
data3 <- fread ("C:\\Benutzer\\Bob\\Desktop\\data.csv")
Dieses Tutorial zeigt ein Beispiel für die Verwendung jeder dieser Methoden zum Importieren der CSV-Datei in R
Wenn Ihre CSV-Datei relativ klein ist, können Sie sie einfach mit der Funktion read.csv von Base R importieren.
Stellen Sie bei Verwendung dieser Methode sicher, dass Sie stringsAsFactors = FALSE angeben, damit R keine Zeichen oder kategorialen Variablen in Faktoren konvertiert.
Der folgende Code zeigt, wie Sie mit read.csv diese CSV-Datei in R importieren:
#Daten importieren
data1 <- read.csv ("C:\\Benutzer\\Bob\\Desktop\\data.csv", header = TRUE, stringsAsFactors = FALSE)
# Struktur der Daten anzeigen
str(data1)
'data.frame': 5 obs. of 3 variables:
$ team : chr "'A'" "'B'" "'C'" "'D'" ...
$ points: int 78 85 93 90 91
$ assists: int 12 20 23 8 14
Wenn Sie mit größeren Dateien arbeiten, können Sie die Funktion read_csv aus dem readr-Paket verwenden:
library(readr)
#Daten importieren
data2 <- read_csv("C:\\Benutzer\\Bob\\Desktop\\data.csv")
#Struktur der Daten anzeigen
str(data2)
'data.frame': 5 obs. of 3 variables:
$ team: chr "'A'" "'B'" "'C'" "'D'" ...
$ points: int 78 85 93 90 91
$ assists: int 12 20 23 8 14
Wenn Ihre CSV-Datei extrem groß ist, können Sie sie am schnellsten mit der fread-Funktion aus dem Paket data.table in R importieren:
library(data.table)
#Daten importieren
data3 <- fread("C:\\Benutzer\\Bob\\Desktop\\data.csv")
# Struktur der Daten anzeigen
str (data3)
Classes 'data.table' and 'data.frame': 5 obs. of 3 variables:
$ team : chr "'A'" "'B'" "'C'" "'D'" ...
$ points: int 78 85 93 90 91
$ assists: int 12 20 23 8 14
Beachten Sie, dass wir in jedem Beispiel doppelte Backslashes (\\) im Dateipfad verwendet haben, um den folgenden häufigen Fehler zu vermeiden:
Error: '\U' used without hex digits in character string starting ""C:\U"
Verwandt: So importieren Sie Excel-Dateien in R
Sie können die Funktion read.delim() verwenden, um Textdateien mit Trennzeichen in R einzulesen.
Diese Funktion verwendet die folgende grundlegende Syntax:
read.delim(file, header=TRUE, sep='\t')
wo:
Sie können die Funktion write.table in R verwenden, um einen Dataframe oder eine Matrix in eine Datei zu exportieren.
Diese Funktion verwendet die folgende grundlegende Syntax:
write.table(df …