Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft sind Sie daran interessiert, den Mittelwert einer oder mehrerer Spalten in einem Pandas DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas einfach mit der Funktion mean() tun.
Dieses Tutorial zeigt einige Beispiele für die Verwendung dieser Funktion.
Angenommen, wir haben die folgenden Pandas DataFrame:
import pandas as pd
import numpy as np
#Dataframe erstellen
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})
#Dataframe anzeigen
df
player points assists rebounds
0 A 25 5 NaN
1 B 20 7 8.0
2 C 14 7 10.0
3 D 16 8 6.0
4 E 27 5 6.0
5 F 20 7 9.0
6 G 12 6 6.0
7 H 15 9 10.0
8 I 14 9 10.0
9 J 19 5 7.0
Wir können den Mittelwert der Spalte mit dem Titel "Punkte" mithilfe der folgenden Syntax ermitteln:
df['points'].mean()
18.2
Die Funktion mean() schließt standardmäßig auch NAs aus. Wenn wir beispielsweise den Mittelwert der Spalte "Rebounds" finden, wird der erste Wert von "NaN" einfach von der Berechnung ausgeschlossen:
df['rebounds'].mean()
8.0
Wenn Sie versuchen, den Mittelwert einer Spalte zu ermitteln, die nicht numerisch ist, wird folgende Fehlermeldung angezeigt:
df['player'].mean()
TypeError: Could not convert ABCDEFGHIJ to numeric
Wir können den Mittelwert mehrerer Spalten mithilfe der folgenden Syntax ermitteln:
# Mittelwert der Punkte- und Rebound-Spalten finden
df[['rebounds', 'points']].mean()
rebounds 8.0
points 18.2
dtype: float64
Wir können auch den Mittelwert aller numerischen Spalten mithilfe der folgenden Syntax ermitteln:
# Mittelwert aller numerischen Spalten in DataFrame finden
df.mean()
points 18.2
assists 6.8
rebounds 8.0
dtype: float64
Beachten Sie, dass die Funktion mean() einfach die Spalten überspringt, die nicht numerisch sind.
Die vollständige Dokumentation zur Funktion mean() finden Sie hier.
Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft möchten Sie einen Pandas-DataFrame nach einer oder mehreren Spalten sortieren. In diesem Tutorial wird erklärt, wie Sie dies mit der pandas sort_values- Funktion tun.