Excel-Dateien sind eine der häufigsten Methoden zum Speichern von Daten. Glücklicherweise können Sie mit der Pandas-Funktion read_excel() problemlos Excel-Dateien einlesen.

In diesem Tutorial werden verschiedene Möglichkeiten zum Einlesen von Excel-Dateien in Python mithilfe von Pandas erläutert.

Beispiel 1: Excel-Datei in einen Pandas-DataFrame einlesen

Angenommen, wir haben die folgende Excel-Datei:

Pdimportexcel

Der folgende Code zeigt, wie Sie mit der Funktion read_excel() diese Excel-Datei in einen Pandas-DataFrame importieren:

import pandas as pd

# Excel-Datei importieren
df = pd.read_excel('data.xlsx')

# Dataframe anzeigen
df

        playerID team   points
0   1    Lakers 26
1   2    Mavs   19
2   3    Bucks  24
3   4    Spurs  22

Beispiel 2: Excel-Datei mit Indexspalte lesen

Manchmal haben Sie auch eine Excel-Datei, in der eine der Spalten eine Indexspalte ist:

Pdimportexcel

In diesem Fall können Sie index_col verwenden, um Pandas mitzuteilen, welche Spalte beim Import als Indexspalte verwendet werden soll:

import pandas as pd

# Excel-Datei importieren und die Indexspalte angeben
df = pd.read_excel('data.xlsx', index_col='index')

# Dataframe anzeigen
df

    playerID    team    points
index           
1   1           Lakers  26
2   2           Mavs    19
3   3           Bucks   24
4   4           Spurs   22

Beispiel 3: Lesen der Excel-Datei mit dem Blattnamen

Sie können auch bestimmte Blattnamen aus einer Excel-Datei in einen Pandas-DataFrame einlesen. Betrachten Sie beispielsweise die folgende Excel-Datei:

Pdimportexcel

Um ein bestimmtes Blatt als Pandas DataFrame einzulesen, können Sie das Argument sheet_name() verwenden:

import pandas as pd

#importiere nur das zweite Blatt
df = pd.read_excel('data.xlsx', sheet_name='second sheet')

# Dataframe anzeigen
df

playerID    team    points
0   1   Lakers  26
1   2   Mavs    19
2   3   Bucks   24
3   4   Spurs   22

Häufiger Fehler: Installieren Sie xlrd

Wenn Sie versuchen, die Funktion read_excel() zu verwenden, tritt möglicherweise der folgende Fehler auf:

ImportError: Install xlrd >= 1.0.0 for Excel support

In diesem Fall müssen Sie zuerst xlrd installieren:

pip install xlrd

Sobald dies installiert ist, können Sie die Funktion read_excel() verwenden.

Zusätzliche Ressourcen

Lesen von CSV-Dateien mit Pandas
So exportieren Sie einen Pandas DataFrame nach Excel

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: