CSV-Dateien (Comma Separated Value) sind eine der häufigsten Methoden zum Speichern von Daten. Glücklicherweise können Sie mit der Pandas-Funktion read_csv() CSV-Dateien in nahezu jedem gewünschten Format problemlos in Python einlesen.

In diesem Tutorial werden verschiedene Möglichkeiten zum Lesen von CSV-Dateien in Python mithilfe der folgenden CSV-Datei mit dem Namen 'data.csv' erläutert:

playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Beispiel 1: CSV-Datei in Pandas DataFrame lesen

Der folgende Code zeigt, wie die CSV-Datei in einen Pandas-DataFrame eingelesen wird:

# CSV-Datei als DataFrame importieren
df = pd.read_csv('data.csv')

# DataFrame anzeigen
df

        playerID  team    points
0   1     Lakers  26
1   2     Mavs    19
2   3     Bucks   24
3   4     Spurs   22

Beispiel 2: Lesen Sie bestimmte Spalten aus der CSV-Datei

Der folgende Code zeigt, wie nur die Spalten "playerID" und "points" in der CSV-Datei in einen Pandas-DataFrame gelesen werden:

# importiere nur bestimmte Spalten aus der CSV-Datei
df = pd.read_csv('data.csv', usecols=['playerID', 'points'])

# DataFrame anzeigen
df

    playerID  points
0   1     26
1   2     19
2   3     24
3   4     22

Alternativ können Sie Spaltenindizes angeben, die in einen Pandas-DataFrame eingelesen werden sollen:

# importiere nur bestimmte Spalten aus der CSV-Datei
df = pd.read_csv('data.csv', usecols=[0, 1])

# DataFrame anzeigen
df

        playerID  team
0   1     Lakers
1   2     Mavs
2   3     Bucks
3   4     Spurs

Beispiel 3: Geben Sie beim Importieren einer CSV-Datei die Kopfzeile an

In einigen Fällen ist die Kopfzeile möglicherweise nicht die erste Zeile in einer CSV-Datei. Betrachten Sie beispielsweise die folgende CSV-Datei, in der die Kopfzeile tatsächlich in der zweiten Zeile angezeigt wird:

random,data,values
playerID,team,points
1,Lakers,26
2,Mavs,19
3,Bucks,24
4,Spurs,22

Um diese CSV-Datei in einen Pandas-DataFrame einzulesen, können Sie den header = 1 wie folgt angeben:

# importieren Sie aus der CSV-Datei und geben Sie an, dass der Header in der zweiten Zeile beginnt
df = pd.read_csv('data.csv', header=1)

# DataFrame anzeigen
df

        playerID team   points
0   1    Lakers 26
1   2    Mavs   19
2   3    Bucks  24
3   4    Spurs  22

Beispiel 4: Zeilen beim Importieren einer CSV-Datei überspringen

Sie können beim Importieren einer CSV-Datei auch einfach Zeilen überspringen, indem Sie das Argument skiprows verwenden. Der folgende Code zeigt beispielsweise, wie die zweite Zeile beim Importieren der CSV-Datei übersprungen wird:

#Importieren Sie aus der CSV-Datei und überspringen Sie die zweite Zeile
df = pd.read_csv('data.csv', skiprows=[1])

# DataFrame anzeigen
df

        playerID team   points
0   2    Mavs   19
1   3    Bucks  24
2   4    Spurs  22

Der folgende Code zeigt, wie Sie die zweite und dritte Zeile beim Importieren der CSV-Datei überspringen:

#importieren Sie aus der CSV-Datei und überspringen Sie die zweite und dritte Zeile
df = pd.read_csv('data.csv', skiprows=[1, 2])

# DataFrame anzeigen
df

        playerID team   points
1   3    Bucks  24
2   4    Spurs  22

Beispiel 5: Lesen von CSV-Dateien mit benutzerdefiniertem Trennzeichen

Gelegentlich haben Sie möglicherweise eine CSV-Datei mit einem Trennzeichen, das sich von einem Komma unterscheidet. Angenommen, unsere CSV-Datei hat einen Unterstrich als Trennzeichen:

playerID_team_points
1_Lakers_26
2_Mavs_19
3_Bucks_24
4_Spurs_22

Um diese CSV-Datei in Pandas zu lesen, können wir das Argument sep verwenden, um das Trennzeichen anzugeben, das beim Lesen der Datei verwendet werden soll:

#importieren Sie aus der CSV-Datei und geben Sie das zu verwendende Trennzeichen an
df = pd.read_csv('data.csv', sep='_')

# DataFrame anzeigen
df

    playerID team   points
0   1    Lakers 26
1   2    Mavs   19
2   3    Bucks  24
3   4    Spurs  22

Die vollständige Dokumentation zur Pandas-Funktion read_csv() finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: