Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft möchten Sie möglicherweise nach mehreren Spalten eines Pandas DataFrame gruppieren und aggregieren. Glücklicherweise ist dies mit den Pandas-Funktionen .groupby() und .agg()einfach zu bewerkstelligen.
In diesem Tutorial werden einige Beispiele für die praktische Verwendung dieser Funktionen erläutert.
Angenommen, wir haben die folgenden Pandas DataFrame:
import pandas as pd
#Dataframe erstellen
df = pd.DataFrame({'team': ['A', 'B', 'B', 'B', 'B', 'M', 'M', 'M'],
'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'],
'assists': [5, 7, 7, 8, 5, 7, 6, 9],
'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]})
#Dataframe anzeigen
print(df)
team position assists rebounds
0 A G 5 11
1 B G 7 8
2 B F 7 10
3 B G 8 6
4 B F 5 6
5 M F 7 9
6 M C 6 6
7 M C 9 10
Der folgende Code zeigt, wie Sie nach den Spalten "Team" und "Position" gruppieren und die mittleren Vorlagen finden:
df.groupby(['team', 'position']).agg({'assists': ['mean']}).reset_index()
team position assists
mean
0 A G 5.0
1 B F 6.0
2 B G 7.5
3 M C 7.5
4 M F 7.0
Die Ausgabe sagt uns:
Und so weiter.
Wir können auch den folgenden Code verwenden, um die Spalten im resultierenden DataFrame umzubenennen:
#Gruppe nach Team und Position und finde gemeine Assists
new = df.groupby(['team', 'position']).agg({'assists': ['mean']}).reset_index()
#Spalten umbenennen
new.columns = ['team', 'pos', 'mean_assists']
#Dataframe anzeigen
print(new)
team pos mean_assists
0 A G 5.0
1 B F 6.0
2 B G 7.5
3 M C 7.5
4 M F 7.0
Angenommen, wir verwenden denselben Pandas-DataFrame wie im vorherigen Beispiel:
import pandas as pd
#Dataframe erstellen
df = pd.DataFrame({'team': ['A', 'B', 'B', 'B', 'B', 'M', 'M', 'M'],
'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'],
'assists': [5, 7, 7, 8, 5, 7, 6, 9],
'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]})
Der folgende Code zeigt, wie Sie den Median und die maximale Anzahl von Rebounds ermitteln, die in den Spalten "team" und "position" gruppiert sind:
df.groupby(['team', 'position']).agg({'rebounds': ['median', 'max']}).reset_index()
team position rebounds
median max
0 A G 11 11
1 B F 8 10
2 B G 7 8
3 M C 8 10
4 M F 9 9
Die Ausgabe sagt uns:
Und so weiter.
So filtern Sie einen Pandas DataFrame unter mehreren Bedingungen
So zählen Sie fehlende Werte in einem Pandas DataFrame
So stapeln Sie mehrere Pandas DataFrames
Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft möchten Sie einen Pandas-DataFrame nach einer oder mehreren Spalten sortieren. In diesem Tutorial wird erklärt, wie Sie dies mit der pandas sort_values- Funktion tun.