Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft sind Sie daran interessiert, die Werte einer Variablen in Python in „Bins“ zu platzieren. Glücklicherweise ist dies mit der Funktion numpy.digitize(), die die folgende Syntax verwendet, einfach zu bewerkstelligen:
numpy.digitize(x, bins, right=False)
wo:
Dieses Tutorial zeigt einige Beispiele für die praktische Verwendung dieser Funktion.
Der folgende Code zeigt, wie die Werte eines Arrays in zwei Bins platziert werden:
import numpy as np
# Daten erstellen
data = [2, 4, 4, 7, 12, 14, 19, 20, 24, 31, 34]
# Werte in Bins platzieren
np.digitize(data, bins=[20])
array([0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1])
Der folgende Code zeigt, wie die Werte eines Arrays in drei Bins platziert werden:
import numpy as np
# Daten erstellen
data = [2, 4, 4, 7, 12, 14, 20, 22, 24, 31, 34]
# Werte in Bins platzieren
np.digitize(data, bins=[10, 20])
array([0, 0, 0, 0, 1, 1, 2, 2, 2, 2, 2])
Beachten Sie, dass die Werte in die folgenden Fächer gestellt werden, wenn wir right = True angeben:
Jedes Intervall würde die rechte Bin-Kante enthalten. So sieht das aus:
import numpy as np
# Daten erstellen
data = [2, 4, 4, 7, 12, 14, 20, 22, 24, 31, 34]
# Werte in Bins platzieren
np.digitize(data, bins=[10, 20], right=True)
array([0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2])
Der folgende Code zeigt, wie die Werte eines Arrays in drei Bins platziert werden:
import numpy as np
# Daten erstellen
data = [2, 4, 4, 7, 12, 14, 20, 22, 24, 31, 34]
# Werte in Bins platzieren
np.digitize(data, bins=[10, 20, 30])
array([0, 0, 0, 0, 1, 1, 2, 2, 2, 3, 3])
Eine weitere nützliche NumPy-Funktion, die die Funktion numpy.digitize() ergänzt, ist die Funktion numpy.bincount (), die die Frequenzen jedes Bin zählt.
Der folgende Code zeigt, wie Sie die Werte eines Arrays in drei Bins platzieren und dann die Häufigkeit jedes Bins zählen:
import numpy as np
# Daten erstellen
data = [2, 4, 4, 7, 12, 14, 20, 22, 24, 31, 34]
# Werte in Bins platzieren
bin_data = np.digitize(data, bins=[10, 20])
# gruppierte Daten anzeigen
bin_data
array([0, 0, 0, 0, 1, 1, 2, 2, 2, 2, 2])
#Zählhäufigkeit jedes Behälters
np.bincount(bin_data)
array([4, 2, 5])
Die Ausgabe sagt uns, dass:
Weitere Python-Tutorials finden Sie hier.
Oft sind Sie daran interessiert, eine oder mehrere Zeichenfolgenspalten in einem Pandas-DataFrame in Float-Spalten zu konvertieren. Glücklicherweise ist dies mit der Funktion astype() einfach zu bewerkstelligen.
Dieses Tutorial zeigt mehrere …
Oft möchten Sie einen Pandas-DataFrame nach einer oder mehreren Spalten sortieren. In diesem Tutorial wird erklärt, wie Sie dies mit der pandas sort_values- Funktion tun.