Oft sind Sie daran interessiert, die Summe einer oder mehrerer Zeilen in einem Pandas DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas einfach mit der sum(axis=1)-Funktion tun.

Dieses Tutorial zeigt einige Beispiele für die Verwendung dieser Funktion auf dem folgenden DataFrame:

import pandas as pd
import numpy as np

#Dataframe erstellen
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [8, np.nan, 10, 6, 6, 9, 6, 10, 10, 7]})

#Dataframe anzeigen 
df


        rating  points  assists rebounds
0   90  25  5   8.0
1   85  20  7   NaN
2   82  14  7   10.0
3   88  16  8   6.0
4   94  27  5   6.0
5   90  20  7   9.0
6   76  12  6   6.0
7   75  15  9   10.0
8   87  14  9   10.0
9   86  19  5   7.07

Beispiel 1: Ermitteln Sie die Summe jeder Zeile

Wir können die Summe jeder Zeile im DataFrame mithilfe der folgenden Syntax ermitteln:

df.sum(axis=1)

0    128.0
1    112.0
2    113.0
3    118.0
4    132.0
5    126.0
6    100.0
7    109.0
8    120.0
9    117.0
dtype: float64

Die Ausgabe sagt uns:

  • Die Summe der Werte in der ersten Zeile beträgt 128.
  • Die Summe der Werte in der zweiten Zeile beträgt 112.
  • Die Summe der Werte in der dritten Zeile beträgt 113.

Und so weiter.

Beispiel 2: Platzieren Sie die Zeilensummen in einer neuen Spalte

Wir können den folgenden Code verwenden, um unserem DataFrame eine Spalte hinzuzufügen, die die Zeilensummen enthält:

# Definieren Sie die neue DataFrame-Spalte 'row_sum' als die Summe jeder Zeile
df['row_sum'] = df.sum(axis=1)

#Dataframe anzeigen
df

rating  points  assists rebounds    row_sum
0   90  25  5   8.0 128.0
1   85  20  7   NaN 112.0
2   82  14  7   10.0    113.0
3   88  16  8   6.0 118.0
4   94  27  5   6.0 132.0
5   90  20  7   9.0 126.0
6   76  12  6   6.0 100.0
7   75  15  9   10.0    109.0
8   87  14  9   10.0    120.0
9   86  19  5   7.0 117.0

Beispiel 3: Suchen Sie die Zeilensummen für eine kurze Liste bestimmter Spalten

Wir können den folgenden Code verwenden, um die Zeilensumme für eine kurze Liste bestimmter Spalten zu ermitteln:

# Definieren Sie eine neue DataFrame-Spalte als Summe der points und assists Spalten
df['sum_pa'] = df['points'] + df['assists']

#Dataframe anzeigen
df

    rating  points  assists rebounds  sum_pa
0   90  25  5   8.0   30
1   85  20  7   NaN   27
2   82  14  7   10.0      21
3   88  16  8   6.0   24
4   94  27  5   6.0   32
5   90  20  7   9.0   27
6   76  12  6   6.0   18
7   75  15  9   10.0      24
8   87  14  9   10.0      23
9   86  19  5   7.0   24

Beispiel 4: Suchen Sie die Zeilensummen für eine lange Liste bestimmter Spalten

Wir können den folgenden Code verwenden, um die Zeilensumme für eine längere Liste bestimmter Spalten zu ermitteln:

# col_list als Liste aller DataFrame-Spaltennamen definieren
col_list= list(df)

# Entfernen Sie die Spalte 'rating' aus der Liste
col_list.remove('rating')

# Neue DataFrame-Spalte als Summe der Zeilen in col_list definieren
df['new_sum'] = df[col_list].sum(axis=1)

# Dataframe anzeigen
df

        rating  points  assists rebounds new_sum
0   90  25  5   8.0  38.0
1   85  20  7   NaN  27.0
2   82  14  7   10.0     31.0
3   88  16  8   6.0  30.0
4   94  27  5   6.0  38.0
5   90  20  7   9.0  36.0
6   76  12  6   6.0  24.0
7   75  15  9   10.0     34.0
8   87  14  9   10.0     33.0
9   86  19  5   7.0  31.0

Die vollständige Dokumentation zur Pandas-Funktion sum() finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: