Oft möchten Sie möglicherweise mehrere Excel-Tabellen in einen einzigen Pandas DataFrame importieren und kombinieren.

Angenommen, Sie haben die folgende Excel-Arbeitsmappe mit dem Namen data.xlsx mit drei verschiedenen Blättern, die alle zwei Datenspalten über Basketballspieler enthalten:

Combinepd

Mit den Pandas-Funktionen concat() und read_excel() können wir jedes Blatt einfach in einen einzelnen Pandas-DataFrame importieren und kombinieren. Zunächst müssen wir jedoch sicherstellen, dass xlrd installiert ist:

pip install xlrd

Sobald dies installiert ist, können wir den folgenden Code verwenden, um diese drei Blätter zu einem Pandas DataFrame zu importieren und zu kombinieren:

# Pandas Bibliothek laden
import pandas as pd

#importiere und kombiniere die drei Blätter zu einem Pandas DataFrame
df = pd.concat(pd.read_excel('data.xlsx', sheet_name=None), ignore_index=True)

# Dataframe anzeigen
df

        player  points
0   A   12
1   B   5
2   C   13
3   D   17
4   E   27
5   F   24
6   G   26
7   H   27
8   I   27
9   J   12
10  K   9
11  L   5
12  M   5
13  N   13
14  O   17

Wie dieser Code funktioniert

Es gibt nur zwei Teile, um zu verstehen, wie diese einzelne Codezeile mehrere Excel-Tabellen importieren und kombinieren kann:

1. Lesen Sie alle Blätter ein.

pd.read_excel('data.xlsx', sheet_name=None)

Dieser Codeabschnitt liest alle Blätter einer Excel-Arbeitsmappe ein. Standardmäßig liest die Funktion read_excel() nur das erste Blatt ein. Durch Angabe von sheet_name = None können wir jedoch jedes einzelne Blatt in der Excel-Arbeitsmappe einlesen.

2. Verketten Sie alle Blätter.

pd.concat(DataFrames to concatenate, ignore_index=True)

Dieser Codeabschnitt verkettet einfach alle DataFrames aus jeder Excel-Tabelle zu einem einzigen Pandas-DataFrame. Durch die Angabe von ignore_index = True teilen wir Pandas mit, dass die Namen der einzelnen Blätter nicht wichtig sind.

Beachten Sie, dass dieser Code nur funktioniert, wenn jede der Excel-Tabellen dasselbe Format hat. In diesem Beispiel hatte jedes Blatt zwei Datenspalten und jede Spalte denselben Namen, weshalb diese einzelne Codezeile so einfach war, jedes der Excel-Blätter zu einem Pandas DataFrame zu kombinieren.

Zusätzliche Ressourcen

Der ultimative Leitfaden: Lesen von Excel-Dateien mit Pandas
So schreiben Sie Pandas DataFrames in mehrere Excel-Tabellen

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: