Die Kovarianz ist ein Maß dafür, wie Änderungen einer Variablen mit Änderungen einer zweiten Variablen verbunden sind. Insbesondere ist es ein Maß für den Grad, in dem zwei Variablen linear verbunden sind.

Die Formel zur Berechnung der Kovarianz zwischen zwei Variablen X und Y lautet:

COV(* X *, Y ) = Σ( x-x )( y-y ) / n

Eine Kovarianzmatrix ist eine quadratische Matrix, die die Kovarianz zwischen vielen verschiedenen Variablen anzeigt. Dies kann eine nützliche Methode sein, um zu verstehen, wie verschiedene Variablen in einem Dataset zusammenhängen.

Das folgende Beispiel zeigt, wie Sie eine Kovarianzmatrix in Google Tabellen für einen bestimmten Datensatz erstellen.

So erstellen Sie eine Kovarianzmatrix in Google Tabellen

Angenommen, wir haben den folgenden Datensatz, der die Testergebnisse von 10 verschiedenen Schülern für drei Fächer zeigt: Mathematik, Naturwissenschaften und Geschichte.

Covmatrixsheets

Um eine Kovarianzmatrix für diesen Datensatz zu erstellen, können wir die Funktion COVAR() mit der folgenden Syntax verwenden:

COVAR(data_y, data_x)

Die Kovarianzmatrix für diesen Datensatz wird in den Zellen B15:D17 angezeigt, während die Formeln zum Erstellen der Kovarianzmatrix in den Zellen B21:D23 unten angezeigt werden:

Kovarianzmatrix in Google Tabellen

So interpretieren Sie eine Kovarianzmatrix

Sobald wir eine Kovarianzmatrix haben, ist es einfach, die Werte in der Matrix zu interpretieren.

Die Werte entlang der Diagonalen der Matrix sind einfach die Varianzen jedes Subjekts. Beispielsweise:

  • Die Varianz der Mathematikwerte beträgt 64,96
  • Die Varianz der Wissenschaftsbewertungen beträgt 56,4
  • Die Varianz der Verlaufswerte beträgt 75,56

Covmatrixsheets

Die anderen Werte in der Matrix repräsentieren die Kovarianzen zwischen den verschiedenen Subjekten. Beispielsweise:

  • Die Kovarianz zwischen den mathematischen und naturwissenschaftlichen Werten beträgt 33,2
  • Die Kovarianz zwischen den mathematischen und historischen Werten beträgt -24,44
  • Die Kovarianz zwischen den Wissenschafts- und Geschichtswerten beträgt -24.1

Covmatrixsheets

Eine positive Zahl für die Kovarianz zeigt an, dass zwei Variablen dazu neigen, gleichzeitig zuzunehmen oder zu sinken. Mathematik und Naturwissenschaften haben beispielsweise eine positive Kovarianz (33,2), was darauf hindeutet, dass Schüler mit guten Ergebnissen in Mathematik auch tendenziell gute Ergebnisse in Naturwissenschaften erzielen. Ebenso tendieren Schüler, die in Mathematik schlecht abschneiden, auch in Naturwissenschaften zu niedrigen Ergebnissen.

Eine negative Zahl für die Kovarianz zeigt an, dass eine zweite Variable tendenziell abnimmt, wenn eine Variable zunimmt. Mathematik und Geschichte weisen beispielsweise eine negative Kovarianz (-24,44) auf, was darauf hindeutet, dass Schüler mit guten Ergebnissen in Mathematik tendenziell niedrige Ergebnisse in Geschichte aufweisen. Ebenso neigen Schüler, die in Mathematik schlecht abschneiden, dazu, in Geschichte hohe Werte zu erzielen.

Zusätzliche Ressourcen

So erstellen Sie eine Kovarianzmatrix in Excel
So erstellen Sie eine Kovarianzmatrix in R
So erstellen Sie eine Kovarianzmatrix in Python
So erstellen Sie eine Kovarianzmatrix in SPSS

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: