So importieren Sie CSV-Dateien in R (Schritt für Schritt)

Von Fabian
Kategorie: R
Tags: Input/Output
Lesezeit: 3 Minuten

Angenommen, ich habe eine CSV-Datei namens data.csv am folgenden Speicherort gespeichert:

C:\Benutzer\Bob\Desktop\data.csv

Angenommen, die CSV-Datei enthält die folgenden Daten:

team, points, assists
'A', 78, 12
'B', 85, 20
'C', 93, 23
'D', 90, 8
'E', 91, 14

Es gibt drei Möglichkeiten, diese CSV-Datei in R zu importieren:

1. Verwenden Sie read.csv direkt von R (langsamste Methode, funktioniert aber gut für kleinere Datensätze)

data1 <- read.csv ("C:\\Benutzer\\Bob\\Desktop\\data.csv", header = TRUE, stringsAsFactors = FALSE)

2. Verwenden Sie read_csv aus dem readr-Paket (2-3x schneller als read.csv).

library(readr)
data2 <- read_csv ("C:\\Benutzer\\Bob\\Desktop\\data.csv")

3. Verwenden Sie fread aus dem data.table-Paket (2-3x schneller als read_r).

library (data.table)

data3 <- fread ("C:\\Benutzer\\Bob\\Desktop\\data.csv")

Dieses Tutorial zeigt ein Beispiel für die Verwendung jeder dieser Methoden zum Importieren der CSV-Datei in R

Methode 1: Verwenden von read.csv

Wenn Ihre CSV-Datei relativ klein ist, können Sie sie einfach mit der Funktion read.csv von Base R importieren.

Stellen Sie bei Verwendung dieser Methode sicher, dass Sie stringsAsFactors = FALSE angeben, damit R keine Zeichen oder kategorialen Variablen in Faktoren konvertiert.

Der folgende Code zeigt, wie Sie mit read.csv diese CSV-Datei in R importieren:

#Daten importieren
data1 <- read.csv ("C:\\Benutzer\\Bob\\Desktop\\data.csv", header = TRUE, stringsAsFactors = FALSE)

# Struktur der Daten anzeigen
str(data1)

'data.frame':   5 obs. of  3 variables:
 $ team : chr  "'A'" "'B'" "'C'" "'D'" ...
 $ points: int  78 85 93 90 91
 $ assists: int  12 20 23 8 14

Methode 2: Verwenden von read_csv

Wenn Sie mit größeren Dateien arbeiten, können Sie die Funktion read_csv aus dem readr-Paket verwenden:

library(readr)

#Daten importieren
data2 <- read_csv("C:\\Benutzer\\Bob\\Desktop\\data.csv")

#Struktur der Daten anzeigen
str(data2)

'data.frame': 5 obs. of 3 variables:
 $ team: chr "'A'" "'B'" "'C'" "'D'" ...
 $ points: int 78 85 93 90 91
 $ assists: int 12 20 23 8 14

Methode 3: Verwenden von Fread

Wenn Ihre CSV-Datei extrem groß ist, können Sie sie am schnellsten mit der fread-Funktion aus dem Paket data.table in R importieren:

library(data.table)

#Daten importieren
data3 <- fread("C:\\Benutzer\\Bob\\Desktop\\data.csv")

# Struktur der Daten anzeigen
str (data3)

Classes 'data.table' and 'data.frame':  5 obs. of  3 variables:
 $ team : chr  "'A'" "'B'" "'C'" "'D'" ...
 $ points: int  78 85 93 90 91
 $ assists: int  12 20 23 8 14

Beachten Sie, dass wir in jedem Beispiel doppelte Backslashes (\\) im Dateipfad verwendet haben, um den folgenden häufigen Fehler zu vermeiden:

Error: '\U' used without hex digits in character string starting ""C:\U"

Verwandt: So importieren Sie Excel-Dateien in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren:
R

So verwenden Sie die read.delim-Funktion in R

Sie können die Funktion read.delim() verwenden, um Textdateien mit Trennzeichen in R einzulesen.

Diese Funktion verwendet die folgende grundlegende Syntax:

read.delim(file, header=TRUE, sep='\t')

wo:

  • file …