So entfernen Sie Zeilen mit einigen oder allen NAs in R

Von Fabian
Kategorie: R
Tags: Operationen
Lesezeit: 2 Minuten

Oft möchten Sie möglicherweise Zeilen mit allen oder einigen NAs (fehlenden Werten) in einem Dataframe in R entfernen.

In diesem Tutorial wird erläutert, wie Sie diese Zeilen mit Base R und dem Tidyr-Paket entfernen. Wir werden das folgende Dataframe für jedes der folgenden Beispiele verwenden:

# Dataframe mit einigen fehlenden Werten erstellen
df <- data.frame(points = c(12, NA, 19, 22, 32),
                 assists = c(4, NA, 3, NA, 5),
                 rebounds = c(5, NA, 7, 12, NA))

#Dataframe anzeigen
df

  points assists rebounds
1     12       4        5
2     NA      NA       NA
3     19       3        7
4     22      NA       12
5     32       5       NA

Entfernen Sie NAs mit Base R

Der folgende Code zeigt, wie Sie mit complete.cases() alle Zeilen in einem Dataframe entfernen, in denen in irgendeiner Spalte ein Wert fehlt:

#Entfernen Sie alle Zeilen mit einem fehlenden Wert in einer beliebigen Spalte
df[complete.cases(df), ]

  points assists rebounds
1     12       4        5
3     19       3        7

Der folgende Code zeigt, wie Sie mithilfe von complete.cases() alle Zeilen in einem Dataframe entfernen, in denen in bestimmten Spalten ein Wert fehlt:

#Entfernen Sie alle Zeilen mit einem fehlenden Wert in der dritten Spalte
df[complete.cases(df[ , 3]),]

  points assists rebounds
1     12       4        5
3     19       3        7
4     22      NA       12

#Entfernen Sie alle Zeilen mit einem fehlenden Wert in der ersten oder dritten Spalte
df[complete.cases(df[ , c(1,3)]),]

  points assists rebounds
1     12       4        5
3     19       3        7
4     22      NA       12

NAs mit Tidyr entfernen

Der folgende Code zeigt, wie Sie mit drop_na() aus dem tidyr-Paket alle Zeilen in einem Dataframe entfernen, in denen in einer Spalte ein Wert fehlt:

# Tidyr-Paket laden
library(tidyr)

#Entfernen Sie alle Zeilen mit einem fehlenden Wert in einer beliebigen Spalte
df %>% drop_na()

  points assists rebounds
1     12       4        5
3     19       3        7

Der folgende Code zeigt, wie Sie mit drop_na() aus dem tidyr-Paket alle Zeilen in einem Dataframe entfernen, in denen in bestimmten Spalten ein Wert fehlt:

# Tidyr-Paket laden
Bibliothek (tidyr)

#Entfernen Sie alle Zeilen mit einem fehlenden Wert in der dritten Spalte
df %>% drop_na(rebounds)

  points assists rebounds
1     12       4        5
3     19       3        7
4     22      NA       12

Weitere R-Tutorials finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: