Den Mittelwert über mehrere Zeilen berechnen R

Von Fabian
Kategorie: R
Lesezeit: 3 Minuten

Oft möchten Sie den Durchschnitt der Werte über mehrere Zeilen in R berechnen. Glücklicherweise ist dies mit der Funktion rowMeans() einfach zu bewerkstelligen.

Dieses Tutorial zeigt einige Beispiele für die praktische Verwendung dieser Funktion.

Beispiel 1: Ermitteln Sie den Durchschnitt über alle Zeilen

Der folgende Code zeigt, wie der Durchschnittswert jeder Zeile über alle Zeilen in einem Dataframe berechnet wird:

#Dataframe erstellen
data <- data.frame(var1 = c(0, NA, 2, 2, 5),
                   var2 = c(5, 5, 7, 8, 9),
                   var3 = c(2, 7, 9, 9, 7))

#Dataframe anzeigen
data

  var1 var2 var3
1    0    5    2
2   NA    5    7
3    2    7    9
4    2    8    9
5    5    9    7

# Durchschnittswert in jeder Zeile finden
rowMeans(data, na.rm=TRUE)

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

Die Ausgabe kann folgendermaßen interpretiert werden:

  • Der Durchschnittswert in der ersten Zeile beträgt 2,333.
  • Der Durchschnittswert in der zweiten Zeile beträgt 6.
  • Der Durchschnittswert in der dritten Zeile beträgt 6.
  • Der Durchschnittswert in der vierten Zeile beträgt 6,333.
  • Der Durchschnittswert in der fünften Zeile beträgt 7.

Sie können diese Zeilenmittelwerte auch einer neuen Variablen im Dataframe zuweisen:

#Zeilendurchschnitte einer neuen Variablen mit dem Namen row_mean zuweisen
data$row_mean <- rowMeans(data, na.rm=TRUE)

#Dataframe anzeigen
data

  var1 var2 var3 row_mean
1    0    5    2 2.333333
2   NA    5    7 6.000000
3    2    7    9 6.000000
4    2    8    9 6.333333
5    5    9    7 7.000000

Beispiel 2: Ermitteln Sie den Durchschnitt über bestimmte Zeilen

Es ist auch möglich, den Durchschnitt nur für bestimmte Zeilen in einem Dataframe zu ermitteln. Der folgende Code zeigt beispielsweise, wie die Zeilenmittelwerte nur für die ersten beiden Zeilen berechnet werden:

# Zeilendurchschnitte über die ersten beiden Zeilen finden
data$new <- rowMeans(data[ , c(1,2)], na.rm=TRUE)

#Dataframe anzeigen
data

  var1 var2 var3 new
1    0    5    2 2.5
2   NA    5    7 5.0
3    2    7    9 4.5
4    2    8    9 5.0
5    5    9    7 7.0

Wir können sehen, dass:

  • Der Durchschnittswert in der ersten Zeile in den ersten beiden Zeilen beträgt 2,5.
  • Der Durchschnittswert in der zweiten Zeile in den ersten beiden Zeilen beträgt 5.

Usw.

Sie können eine ähnliche Syntax verwenden, um die Zeilenmittelwerte für einen beliebigen Satz von Zeilen zu ermitteln. Der folgende Code zeigt beispielsweise, wie die Zeilendurchschnitte nur für die erste und dritte Zeile berechnet werden:

#Zeilendurchschnitte über die erste und dritte Zeile finden
data$new <- rowMeans(data[ , c(1,3)], na.rm=TRUE)

# Dataframe anzeigen
data

  var1 var2 var3 new
1    0    5    2 1.0
2   NA    5    7 7.0
3    2    7    9 5.5
4    2    8    9 5.5
5    5    9    7 6.0

Wir können sehen, dass:

  • Der Durchschnittswert in der ersten Zeile in der ersten und dritten Zeile beträgt 1.
  • Der Durchschnittswert in der zweiten Zeile in der ersten und dritten Zeile beträgt 7.

Usw.

Weitere R-Tutorials finden Sie hier.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: