Oft sind Sie daran interessiert, den Mittelwert einer oder mehrerer Spalten in einem Pandas DataFrame zu berechnen. Glücklicherweise können Sie dies in Pandas einfach mit der Funktion mean() tun.

Dieses Tutorial zeigt einige Beispiele für die Verwendung dieser Funktion.

Beispiel 1: Ermitteln Sie den Mittelwert einer einzelnen Spalte

Angenommen, wir haben die folgenden Pandas DataFrame:

import pandas as pd
import numpy as np

#Dataframe erstellen
df = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [np.nan, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#Dataframe anzeigen 
df


        player  points  assists rebounds
0   A   25  5   NaN
1   B   20  7   8.0
2   C   14  7   10.0
3   D   16  8   6.0
4   E   27  5   6.0
5   F   20  7   9.0
6   G   12  6   6.0
7   H   15  9   10.0
8   I   14  9   10.0
9   J   19  5   7.0

Wir können den Mittelwert der Spalte mit dem Titel "Punkte" mithilfe der folgenden Syntax ermitteln:

df['points'].mean()

18.2

Die Funktion mean() schließt standardmäßig auch NAs aus. Wenn wir beispielsweise den Mittelwert der Spalte "Rebounds" finden, wird der erste Wert von "NaN" einfach von der Berechnung ausgeschlossen:

df['rebounds'].mean()

8.0

Wenn Sie versuchen, den Mittelwert einer Spalte zu ermitteln, die nicht numerisch ist, wird folgende Fehlermeldung angezeigt:

df['player'].mean()

TypeError: Could not convert ABCDEFGHIJ to numeric

Beispiel 2: Ermitteln Sie den Mittelwert mehrerer Spalten

Wir können den Mittelwert mehrerer Spalten mithilfe der folgenden Syntax ermitteln:

# Mittelwert der Punkte- und Rebound-Spalten finden
df[['rebounds', 'points']].mean()

rebounds     8.0
points      18.2
dtype: float64

Beispiel 3: Ermitteln Sie den Mittelwert aller Spalten

Wir können auch den Mittelwert aller numerischen Spalten mithilfe der folgenden Syntax ermitteln:

# Mittelwert aller numerischen Spalten in DataFrame finden
df.mean()

points      18.2
assists      6.8
rebounds     8.0
dtype: float64

Beachten Sie, dass die Funktion mean() einfach die Spalten überspringt, die nicht numerisch sind.

Die vollständige Dokumentation zur Funktion mean() finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: