Gelegentlich möchten Sie einem Pandas DataFrame möglicherweise ein NumPy-Array als neue Spalte hinzufügen.

Glücklicherweise können Sie dies einfach mit der folgenden Syntax tun:

df['new_column'] = array_name.tolist()

Dieses Tutorial zeigt einige Beispiele für die praktische Verwendung dieser Syntax.

Beispiel 1: Hinzufügen eines NumPy-Arrays als neue Spalte in DataFrame

Der folgende Code zeigt, wie Sie einen Pandas-DataFrame erstellen, der einige Statistiken für Basketballspieler enthält, und ein NumPy-Array als neue Spalte mit dem Titel "blocks" anhängen:

import numpy as np
import pandas as pd

# Pandas DataFrame erstellen
df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23, 25, 29],
                   'assists': [5, 7, 7, 9, 12, 9, 9, 4],
                   'rebounds': [11, 8, 10, 6, 6, 5, 9, 12]})

# NumPy-Array für 'blocks' erstellen
blocks = np.array([2, 3, 1, 0, 2, 7, 8, 2])

#'blocks' Array als neue Spalte in DataFrame hinzufügen
df['blocks'] = blocks.tolist()

# DataFrame anzeigen
print(df)

   points  assists  rebounds  blocks
0      25        5        11       2
1      12        7         8       3
2      15        7        10       1
3      14        9         6       0
4      19       12         6       2
5      23        9         5       7
6      25        9         9       8
7      29        4        12       2

Beachten Sie, dass der neue DataFrame jetzt eine zusätzliche Spalte mit dem Titel blocks enthält.

Beispiel 2: Hinzufügen einer NumPy-Matrix als neue Spalten in DataFrame

Der folgende Code zeigt, wie Sie einen Pandas-DataFrame erstellen, der einige Statistiken für Basketballspieler enthält, und ein NumPy-Array als neue Spalte mit dem Titel "blocks" anhängen:

import numpy as np
import pandas as pd

# Pandas DataFrame erstellen
df = pd.DataFrame({'points': [25, 12, 15, 14, 19, 23

# NumPy-Matrix erstellen
mat = np.matrix([[2, 3],
                 [1, 0],
                 [2, 7],
                 [8, 2],
                 [3, 4],
                 [7, 7],
                 [7, 5],
                 [6, 3]])

# NumPy Matrix als neue Spalten in DataFrame hinzufügen
df_new = pd.concat([df, pd.DataFrame(mat)], axis=1)

#Neues DataFrame anzeigen
print(df_new)

   points  assists  rebounds  0  1
0      25        5        11  2  3
1      12        7         8  1  0
2      15        7        10  2  7
3      14        9         6  8  2
4      19       12         6  3  4
5      23        9         5  7  7
6      25        9         9  7  5
7      29        4        12  6  3

Beachten Sie, dass die Namen der Spalten für die Matrix, die wir dem DataFrame hinzugefügt haben, die Standardspaltennamen 0 und 1 erhalten.

Wir können diese Spalten einfach mit der Funktion df.columns umbenennen:

# Spalten umbenennen
df_new.columns = ['pts', 'ast', 'rebs', 'new1', 'new2']

# Dataframe anzeigen
print(df_new)

   pts  ast  rebs  new1  new2
0   25    5    11     2     3
1   12    7     8     1     0
2   15    7    10     2     7
3   14    9     6     8     2
4   19   12     6     3     4
5   23    9     5     7     7
6   25    9     9     7     5
7   29    4    12     6     3

Zusätzliche Ressourcen

So stapeln Sie mehrere Pandas DataFrames
So führen Sie zwei Pandas DataFrames im Index zusammen
So benennen Sie Spalten in Pandas um

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: