Eine Möglichkeit, die Beziehung zwischen zwei Variablen zu quantifizieren, besteht darin, den Korrelationskoeffizienten nach Pearson zu verwenden, der ein Maß für den linearen Zusammenhang zwischen zwei Variablen ist . Es hat einen Wert zwischen -1 und 1, wobei:

  • -1 zeigt eine perfekt negative lineare Korrelation zwischen zwei Variablen an
  • 0 bedeutet keine lineare Korrelation zwischen zwei Variablen
  • 1 zeigt eine perfekt positive lineare Korrelation zwischen zwei Variablen an

Je weiter der Korrelationskoeffizient von Null entfernt ist, desto stärker ist der Zusammenhang zwischen den beiden Variablen.

In einigen Fällen möchten wir jedoch die Korrelation zwischen mehr als nur einem Variablenpaar verstehen. In diesen Fällen können wir eine Korrelationsmatrix erstellen, bei der es sich um eine quadratische Tabelle handelt, die die Korrelationskoeffizienten zwischen mehreren paarweisen Kombinationen von Variablen anzeigt.

In diesem Tutorial wird erläutert, wie Sie eine Korrelationsmatrix in Google Tabellen erstellen und interpretieren.

So erstellen Sie eine Korrelationsmatrix in Google Tabellen

Angenommen, wir haben den folgenden Datensatz, der die durchschnittliche Anzahl von Punkten, Rebounds und Assists für 10 Basketballspieler zeigt:

Um eine Korrelationsmatrix für diesen Datensatz zu erstellen, können wir die Funktion CORREL() mit der folgenden Syntax verwenden:

COVAR(data_y, data_x)

Die Kovarianzmatrix für diesen Datensatz wird in den Zellen B15:D17 angezeigt, während die Formeln zum Erstellen der Kovarianzmatrix in den Zellen B21:D23 unten angezeigt werden:

Korrelationsmatrix in Google Tabellen

So interpretieren Sie eine Korrelationsmatrix

Die Werte in den einzelnen Zellen der Korrelationsmatrix sagen uns den Pearson-Korrelationskoeffizienten zwischen jeder paarweisen Kombination von Variablen. Beispielsweise:

Korrelation zwischen Points und Rebounds: -0,0464. Punkte und Rebounds sind leicht negativ korreliert, aber dieser Wert liegt so nahe bei Null, dass es keine starken Beweise für einen signifikanten Zusammenhang zwischen diesen beiden Variablen gibt.

Korrelation zwischen Points und Assists: 0,1219. Punkte und Assists sind leicht positiv korreliert, aber dieser Wert liegt auch ziemlich nahe bei Null, sodass es keine starken Beweise für einen signifikanten Zusammenhang zwischen diesen beiden Variablen gibt.

Korrelation zwischen Rebounds und Assists: 0,7137. Rebounds und Assists sind stark positiv korreliert. Das heißt, Spieler mit mehr Rebounds haben tendenziell auch mehr Assists.

Beachten Sie, dass die Diagonalwerte in der Korrelationsmatrix alle gleich 1 sind, da die Korrelation zwischen einer Variablen und sich selbst immer 1 ist. In der Praxis ist diese Zahl nicht sinnvoll zu interpretieren.

Zusätzliche Ressourcen

So lesen Sie eine Korrelationsmatrix
So erstellen Sie eine Korrelationsmatrix in Excel

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: