Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft sind Sie daran interessiert, die Summe einer oder mehrerer Zeilen in einem Pandas DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas einfach mit der sum(axis=1)-Funktion tun.
Dieses Tutorial zeigt einige Beispiele für die Verwendung dieser Funktion auf dem folgenden DataFrame:
import pandas as pd
import numpy as np
#Dataframe erstellen
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
'rebounds': [8, np.nan, 10, 6, 6, 9, 6, 10, 10, 7]})
#Dataframe anzeigen
df
rating points assists rebounds
0 90 25 5 8.0
1 85 20 7 NaN
2 82 14 7 10.0
3 88 16 8 6.0
4 94 27 5 6.0
5 90 20 7 9.0
6 76 12 6 6.0
7 75 15 9 10.0
8 87 14 9 10.0
9 86 19 5 7.07
Wir können die Summe jeder Zeile im DataFrame mithilfe der folgenden Syntax ermitteln:
df.sum(axis=1)
0 128.0
1 112.0
2 113.0
3 118.0
4 132.0
5 126.0
6 100.0
7 109.0
8 120.0
9 117.0
dtype: float64
Die Ausgabe sagt uns:
Und so weiter.
Wir können den folgenden Code verwenden, um unserem DataFrame eine Spalte hinzuzufügen, die die Zeilensummen enthält:
# Definieren Sie die neue DataFrame-Spalte 'row_sum' als die Summe jeder Zeile
df['row_sum'] = df.sum(axis=1)
#Dataframe anzeigen
df
rating points assists rebounds row_sum
0 90 25 5 8.0 128.0
1 85 20 7 NaN 112.0
2 82 14 7 10.0 113.0
3 88 16 8 6.0 118.0
4 94 27 5 6.0 132.0
5 90 20 7 9.0 126.0
6 76 12 6 6.0 100.0
7 75 15 9 10.0 109.0
8 87 14 9 10.0 120.0
9 86 19 5 7.0 117.0
Wir können den folgenden Code verwenden, um die Zeilensumme für eine kurze Liste bestimmter Spalten zu ermitteln:
# Definieren Sie eine neue DataFrame-Spalte als Summe der points und assists Spalten
df['sum_pa'] = df['points'] + df['assists']
#Dataframe anzeigen
df
rating points assists rebounds sum_pa
0 90 25 5 8.0 30
1 85 20 7 NaN 27
2 82 14 7 10.0 21
3 88 16 8 6.0 24
4 94 27 5 6.0 32
5 90 20 7 9.0 27
6 76 12 6 6.0 18
7 75 15 9 10.0 24
8 87 14 9 10.0 23
9 86 19 5 7.0 24
Wir können den folgenden Code verwenden, um die Zeilensumme für eine längere Liste bestimmter Spalten zu ermitteln:
# col_list als Liste aller DataFrame-Spaltennamen definieren
col_list= list(df)
# Entfernen Sie die Spalte 'rating' aus der Liste
col_list.remove('rating')
# Neue DataFrame-Spalte als Summe der Zeilen in col_list definieren
df['new_sum'] = df[col_list].sum(axis=1)
# Dataframe anzeigen
df
rating points assists rebounds new_sum
0 90 25 5 8.0 38.0
1 85 20 7 NaN 27.0
2 82 14 7 10.0 31.0
3 88 16 8 6.0 30.0
4 94 27 5 6.0 38.0
5 90 20 7 9.0 36.0
6 76 12 6 6.0 24.0
7 75 15 9 10.0 34.0
8 87 14 9 10.0 33.0
9 86 19 5 7.0 31.0
Die vollständige Dokumentation zur Pandas-Funktion sum() finden Sie hier.
Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft möchten Sie einen Pandas-DataFrame nach einer oder mehreren Spalten sortieren. In diesem Tutorial wird erklärt, wie Sie dies mit der pandas sort_values- Funktion tun.