So berechnen Sie den Mittelwert mehrerer Spalten in R

Von Fabian
Kategorie: R
Lesezeit: 2 Minuten

Oft möchten Sie den Mittelwert mehrerer Spalten in R berechnen. Glücklicherweise können Sie dies einfach mit der Funktion colMeans() tun.

colMeans(df)

Die folgenden Beispiele zeigen, wie diese Funktion in der Praxis verwendet wird.

Verwenden von colMeans() zum Ermitteln des Mittelwerts mehrerer Spalten

Der folgende Code zeigt, wie mit der Funktion colMeans() der Mittelwert jeder Spalte in einem Dataframe ermittelt wird:

#Dataframe erstellen
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#Mittelwert jeder Spalte finden
colMeans(df)

var1 var2 var3 var4 
 3.2  5.4  5.2  4.2 

Wir können auch angeben, für welche Spalten der Mittelwert ermittelt werden soll:

#Finden Sie den Mittelwert der Spalten 2 und 3
colMeans(df[ , c(2, 3)])

var2 var3 
 5.4  5.2 

#Finden Sie den Mittelwert der ersten drei Spalten
colMeans(df[ , 1:3])

var1 var2 var3 
 3.2  5.4  5.2

Wenn es einige Spalten gibt, die nicht numerisch sind, können Sie mit sapply() angeben, dass Sie nur den Mittelwert von Spalten ermitteln möchten, die numerisch sind:

#Dataframe erstellen
df <- data.frame(var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9),
                 var5=c('a', 'a', 'b', 'b', 'c'))

#Mittelwert der numerischen Spalten finden
colMeans(df[sapply(df, is.numeric)])

var1 var2 var3 var4 
 3.2  5.4  5.2  4.2 

Und wenn in einer Spalte Werte fehlen, können Sie das Argument na.rm = TRUE verwenden, um fehlende Werte bei der Berechnung der Mittelwerte zu ignorieren:

#Dataframe mit einigen fehlenden Werten erstellen
df <- data.frame(var1=c(1, 3, NA, NA, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, NA))

#Finden Sie den Mittelwert jeder Spalte und ignorieren Sie fehlende Werte
colMeans(df, na.rm=TRUE)

var1 var2 var3 var4 
 3.0  5.4  5.2  3.0

Zusätzliche Ressourcen

So summieren Sie bestimmte Spalten in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: