CSV-Dateien (Comma Separated Value) sind eine der häufigsten Methoden zum Speichern von Daten. Glücklicherweise können Sie mit der Pandas-Funktion read_csv() CSV-Dateien in nahezu jedem gewünschten Format problemlos in Python einlesen.
In diesem Tutorial werden verschiedene Möglichkeiten zum Lesen von CSV-Dateien in Python mithilfe der folgenden CSV-Datei mit dem Namen 'data.csv' erläutert:
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22
Beispiel 1: CSV-Datei in Pandas DataFrame lesen
Der folgende Code zeigt, wie die CSV-Datei in einen Pandas-DataFrame eingelesen wird:
# CSV-Datei als DataFrame importieren
df = pd.read_csv('data.csv')
# DataFrame anzeigen
df
playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22
Beispiel 2: Lesen Sie bestimmte Spalten aus der CSV-Datei
Der folgende Code zeigt, wie nur die Spalten "playerID" und "points" in der CSV-Datei in einen Pandas-DataFrame gelesen werden:
# importiere nur bestimmte Spalten aus der CSV-Datei
df = pd.read_csv('data.csv', usecols=['playerID', 'points'])
# DataFrame anzeigen
df
playerID points
0 1 26
1 2 19
2 3 24
3 4 22
Alternativ können Sie Spaltenindizes angeben, die in einen Pandas-DataFrame eingelesen werden sollen:
# importiere nur bestimmte Spalten aus der CSV-Datei
df = pd.read_csv('data.csv', usecols=[0, 1])
# DataFrame anzeigen
df
playerID team
0 1 Lakers
1 2 Mavs
2 3 Bucks
3 4 Spurs
Beispiel 3: Geben Sie beim Importieren einer CSV-Datei die Kopfzeile an
In einigen Fällen ist die Kopfzeile möglicherweise nicht die erste Zeile in einer CSV-Datei. Betrachten Sie beispielsweise die folgende CSV-Datei, in der die Kopfzeile tatsächlich in der zweiten Zeile angezeigt wird:
random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22
Um diese CSV-Datei in einen Pandas-DataFrame einzulesen, können Sie den header = 1 wie folgt angeben:
# importieren Sie aus der CSV-Datei und geben Sie an, dass der Header in der zweiten Zeile beginnt
df = pd.read_csv('data.csv', header=1)
# DataFrame anzeigen
df
playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22
Beispiel 4: Zeilen beim Importieren einer CSV-Datei überspringen
Sie können beim Importieren einer CSV-Datei auch einfach Zeilen überspringen, indem Sie das Argument skiprows verwenden. Der folgende Code zeigt beispielsweise, wie die zweite Zeile beim Importieren der CSV-Datei übersprungen wird:
#Importieren Sie aus der CSV-Datei und überspringen Sie die zweite Zeile
df = pd.read_csv('data.csv', skiprows=[1])
# DataFrame anzeigen
df
playerID team points
0 2 Mavs 19
1 3 Bucks 24
2 4 Spurs 22
Der folgende Code zeigt, wie Sie die zweite und dritte Zeile beim Importieren der CSV-Datei überspringen:
#importieren Sie aus der CSV-Datei und überspringen Sie die zweite und dritte Zeile
df = pd.read_csv('data.csv', skiprows=[1, 2])
# DataFrame anzeigen
df
playerID team points
1 3 Bucks 24
2 4 Spurs 22
Beispiel 5: Lesen von CSV-Dateien mit benutzerdefiniertem Trennzeichen
Gelegentlich haben Sie möglicherweise eine CSV-Datei mit einem Trennzeichen, das sich von einem Komma unterscheidet. Angenommen, unsere CSV-Datei hat einen Unterstrich als Trennzeichen:
playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22
Um diese CSV-Datei in Pandas zu lesen, können wir das Argument sep verwenden, um das Trennzeichen anzugeben, das beim Lesen der Datei verwendet werden soll:
#importieren Sie aus der CSV-Datei und geben Sie das zu verwendende Trennzeichen an
df = pd.read_csv('data.csv', sep='_')
# DataFrame anzeigen
df
playerID team points
0 1 Lakers 26
1 2 Mavs 19
2 3 Bucks 24
3 4 Spurs 22
Die vollständige Dokumentation zur Pandas-Funktion read_csv() finden Sie hier.