Der einfachste Weg, Arrays in Python zu verketten, ist die Verwendung der Funktion numpy.concatenate, die die folgende Syntax verwendet:
numpy.concatenate((a1, a2, ….), axis = 0)
wo:
- a1, a2 …: Die …
Zwei Funktionen, die in R häufig verwechselt werden, sind grep() und grepl(). Mit beiden Funktionen können Sie sehen, ob ein bestimmtes Muster in einer Zeichenfolge vorhanden ist, sie liefern jedoch unterschiedliche Ergebnisse:
Das folgende Beispiel veranschaulicht diesen Unterschied:
#Erstellen Sie einen Datenvektor
data <- c('P Guard', 'S Guard', 'S Forward', 'P Forward', 'Center')
grep('Guard', data)
[1] 1 2
grepl('Guard', data)
[1] TRUE TRUE FALSE FALSE FALSE
Die folgenden Beispiele zeigen, wann Sie eine dieser Funktionen über die andere verwenden möchten.
1. Filtern von Zeilen, die eine bestimmte Zeichenfolge enthalten
Eine der häufigsten Anwendungen von grepl() ist das Filtern von Zeilen in einem Dataframe, die eine bestimmte Zeichenfolge enthalten:
library(dplyr)
#Dataframe erstellen
df <- data.frame(player = c('P Guard', 'S Guard', 'S Forward', 'P Forward', 'Center'),
points = c(12, 15, 19, 22, 32),
rebounds = c(5, 7, 7, 12, 11))
#Filtern von Zeilen, die die Zeichenfolge 'Guard' in der Player-Spalte enthalten
df %>% filter(grepl('Guard', player))
player points rebounds
1 P Guard 12 5
2 S Guard 15 7
1. Wählen Sie Spalten aus, die eine bestimmte Zeichenfolge enthalten
Mit grep() können Sie Spalten in einem Dataframe auswählen, die eine bestimmte Zeichenfolge enthalten:
library(dplyr)
#Dataframe erstellen
df <- data.frame(player = c('P Guard', 'S Guard', 'S Forward', 'P Forward', 'Center'),
points = c(12, 15, 19, 22, 32),
rebounds = c(5, 7, 7, 12, 11))
#Wählen Sie Spalten aus, deren Name die Zeichenfolge 'p' enthält
df %>% select(grep('p', colnames(df)))
player points
1 P Guard 12
2 S Guard 15
3 S Forward 19
4 P Forward 22
5 Center 32
2. Zählen Sie die Anzahl der Zeilen, die eine bestimmte Zeichenfolge enthalten
Mit grep() können Sie die Anzahl der Zeilen in einem Dataframe zählen, die eine bestimmte Zeichenfolge enthalten:
#Dataframe erstellen
df <- data.frame(player = c('P Guard', 'S Guard', 'S Forward', 'P Forward', 'Center'),
points = c(12, 15, 19, 22, 32),
rebounds = c(5, 7, 7, 12, 11))
#Zählen Sie, wie viele Zeilen die Zeichenfolge 'Guard' in der Player-Spalte enthalten
length(grep('Guard', df$player))
[1] 2
Weitere R-Tutorials finden Sie hier.
Der einfachste Weg, Arrays in Python zu verketten, ist die Verwendung der Funktion numpy.concatenate, die die folgende Syntax verwendet:
numpy.concatenate((a1, a2, ….), axis = 0)
wo:
Häufig möchten Sie möglicherweise nur die Anzahl der Zeilen in einem pandas-DataFrame zählen, die bestimmte Kriterien erfüllen.
Glücklicherweise ist dies mit der folgenden grundlegenden Syntax einfach zu bewerkstelligen:
sum(df …