Oft sind Sie daran interessiert, alle eindeutigen Werte in mehreren Spalten eines Pandas DataFrame zu finden. Glücklicherweise ist dies mit der Funktion Pandas unique() in Kombination mit der Funktion ravel …
Oft möchten Sie möglicherweise die Anzahl der fehlenden Werte in einem Pandas DataFrame zählen.
Dieses Tutorial zeigt einige Beispiele zum Zählen fehlender Werte mit dem folgenden DataFrame:
import pandas as pd
import numpy as np
# Dataframe erstellen mit einigen fehlenden Werten
df = pd.DataFrame({'a': [4, np.nan, np.nan, 7, 8, 12],
'b': [np.nan, 6, 8, 14, 29, np.nan],
'c': [11, 8, 10, 6, 6, np.nan]})
# Dataframe anzeigen
print(df)
a b c
0 4.0 NaN 11.0
1 NaN 6.0 8.0
2 NaN 8.0 10.0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12.0 NaN NaN
Zählen Sie die insgesamt fehlenden Werte im gesamten DataFrame
Der folgende Code zeigt, wie die Gesamtzahl der fehlenden Werte im gesamten DataFrame berechnet wird:
df.isnull().sum().sum()
5
Dies sagt uns, dass insgesamt 5 Werte fehlen.
Zählen Sie die insgesamt fehlenden Werte pro Spalte
Der folgende Code zeigt, wie die Gesamtzahl der fehlenden Werte in jeder Spalte des DataFrame berechnet wird:
df.isnull().sum()
a 2
b 2
c 1
Dies sagt uns:
- Spalte 'a' hat 2 fehlende Werte.
- Spalte 'b' hat 2 fehlende Werte.
- Spalte 'c' hat 1 fehlenden Wert.
Sie können die Anzahl der fehlenden Werte auch als Prozentsatz der gesamten Spalte anzeigen:
df.isnull().sum()/len(df)*100
a 33.333333
b 33.333333
c 16.666667
Dies sagt uns:
- 33,33% der Werte in Spalte 'a' fehlen.
- 33,33% der Werte in Spalte 'b' fehlen.
- 16,67% der Werte in Spalte 'c' fehlen.
Zählen Sie die gesamten fehlenden Werte pro Zeile
Der folgende Code zeigt, wie die Gesamtzahl der fehlenden Werte in jeder Zeile des DataFrame berechnet wird:
df.isnull().sum(axis=1)
0 1
1 1
2 1
3 0
4 0
5 2
Dies sagt uns:
- Zeile 1 hat 1 fehlenden Wert.
- Zeile 2 hat 1 fehlenden Wert.
- Zeile 3 hat 1 fehlenden Wert.
- Zeile 4 enthält 0 fehlende Werte.
- Zeile 5 enthält 0 fehlende Werte.
- Zeile 6 hat 2 fehlende Werte.
Zusätzliche Ressourcen
So finden Sie eindeutige Werte in mehreren Spalten in Pandas
So finden Sie eindeutige Werte in mehreren Spalten in Pandas
So filtern Sie Pandas DataFrame-Zeilen nach Datum
Oft möchten Sie die Zeilen eines Pandas DataFrame nach Datum filtern. Praktischerweise ist dies ziemlich einfach und in diesem Tutorial werden je nach Struktur Ihres DataFrame zwei Möglichkeiten erläutert.