Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Der einfachste Weg, doppelte Zeilen in einem Pandas-DataFrame zu löschen, ist die Verwendung der Funktion drop_duplicates(), die die folgende Syntax verwendet:
df.drop_duplicates(subset=None, keep=’first’, inplace=False)
wo:
Dieses Tutorial enthält einige Beispiele für die praktische Verwendung dieser Funktion auf dem folgenden DataFrame:
import pandas as pd
# Dataframe erstellen
df = pd.DataFrame({'team': ['a', 'b', 'b', 'c', 'c', 'd'],
'points': [3, 7, 7, 8, 8, 9],
'assists': [8, 6, 7, 9, 9, 3]})
# DataFrame anzeigen
print(df)
team points assists
0 a 3 8
1 b 7 6
2 b 7 7
3 c 8 9
4 c 8 9
5 d 9 3
Der folgende Code zeigt, wie Zeilen mit doppelten Werten in allen Spalten entfernt werden:
df.drop_duplicates()
team points assists
0 a 3 8
1 b 7 6
2 b 7 7
3 c 8 9
5 d 9 3
Standardmäßig löscht die Funktion drop_duplicates() alle Duplikate mit Ausnahme des ersten.
Wir könnten jedoch das Argument keep = False verwenden, um alle Duplikate vollständig zu löschen:
df.drop_duplicates(keep=False)
team points assists
0 a 3 8
1 b 7 6
2 b 7 7
5 d 9 3
Der folgende Code zeigt, wie Zeilen mit doppelten Werten nur in den Spalten mit dem Titel team und points entfernt werden* :
df.drop_duplicates(subset=['team', 'points'])
team points assists
0 a 3 8
1 b 7 6
3 c 8 9
5 d 9 3
So sortieren Sie Werte in einem Pandas DataFrame
So filtern Sie einen Pandas DataFrame unter mehreren Bedingungen
So fügen Sie eine Spalte in einen Pandas DataFrame ein
Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft möchten Sie einen Pandas-DataFrame nach einer oder mehreren Spalten sortieren. In diesem Tutorial wird erklärt, wie Sie dies mit der pandas sort_values- Funktion tun.