Um eine Textdatei mit Pandas in Python zu lesen, können Sie die folgende grundlegende Syntax verwenden:

df = pd.read_csv("data.txt", sep=" ")

Dieses Tutorial enthält einige Beispiele für die praktische Verwendung dieser Funktion.

Lesen Sie eine Textdatei mit einer Kopfzeile

Angenommen, wir haben die folgende Textdatei namens data.txt mit einem Header:

Lesen Sie die Textdatei in Pandas

Um diese Datei in einen Pandas DataFrame einzulesen, können wir die folgende Syntax verwenden:

import pandas as pd

# Textdatei in Pandas DataFrame lesen
df = pd.read_csv("data.txt", sep=" ")

# DataFrame anzeigen
print(df)

   column1  column2
0        1        4
1        3        4
2        2        5
3        7        9
4        9        1
5        6        3
6        4        4
7        5        2
8        4        8
9        6        8

Wir können die Klasse des DataFrame ausgeben und die Anzahl der Zeilen und Spalten mithilfe der folgenden Syntax ermitteln:

# Klasse des DataFrame anzeigen
print(type(df))

<class 'pandas.core.frame.DataFrame'>

# Anzahl der Zeilen und Spalten im DataFrame anzeigen
df.shape

(10, 2)

Wir können sehen, dass df ein Pandas DataFrame mit 10 Zeilen und 2 Spalten ist.

Lesen Sie eine Textdatei ohne Kopfzeile

Angenommen, wir haben die folgende Textdatei mit dem Namen data.txt ohne Header:

Pandas lesen Textdateien ohne Überschriften

Um diese Datei in einen Pandas DataFrame einzulesen, können wir die folgende Syntax verwenden:

# Textdatei in Pandas DataFrame lesen
df = pd.read_csv("data.txt", sep=" ", header=None)

# DataFrame anzeigen
print(df)

   0  1
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Da die Textdatei keine Überschriften hatte, benannten Pandas einfach die Spalten 0 und 1.

Lesen Sie eine Textdatei ohne Kopfzeile und geben Sie Spaltennamen an

Wenn wir möchten, können wir beim Importieren der Textdatei Spaltennamen zuweisen, indem wir das Argument names verwenden:

#Lesen Sie die Textdatei in Pandas DataFrame und geben Sie die Spaltennamen an
df = pd.read_csv("data.txt", sep=" ", header=None, names=["A", "B"])

#DataFrame anzeigen
print(df)

   A  B
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Zusätzliche Ressourcen

Lesen von CSV-Dateien mit Pandas
Lesen von Excel-Dateien mit Pandas
Lesen einer JSON-Datei mit Pandas

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: