Eine Möglichkeit, die Beziehung zwischen zwei Variablen zu quantifizieren, besteht darin, den Pearson-Korrelationskoeffizienten zu verwenden, der ein Maß für die lineare Assoziation zwischen zwei Variablen ist . Es hat einen Wert zwischen -1 und 1, wobei:

  • -1 zeigt eine vollkommen negative lineare Korrelation zwischen zwei Variablen an
  • 0 zeigt keine lineare Korrelation zwischen zwei Variablen an
  • 1 zeigt eine vollkommen positive lineare Korrelation zwischen zwei Variablen an

Je weiter der Korrelationskoeffizient von Null entfernt ist, desto stärker ist die Beziehung zwischen den beiden Variablen.

In einigen Fällen möchten wir jedoch die Korrelation zwischen mehr als nur einem Variablenpaar verstehen. In diesen Fällen können wir eine Korrelationsmatrix erstellen, bei der es sich um eine quadratische Tabelle handelt, die die Korrelationskoeffizienten zwischen mehreren paarweisen Kombinationen von Variablen zeigt.

In diesem Tutorial wird erklärt, wie Sie eine Korrelationsmatrix in Excel erstellen und interpretieren.

So erstellen Sie eine Korrelationsmatrix in Excel

Angenommen, wir haben den folgenden Datensatz, der die durchschnittliche Anzahl von Punkten, Rebounds und Assists für 10 Basketballspieler anzeigt:

Datensatz

Um eine Korrelationsmatrix für dieses Dataset zu erstellen, wechseln Sie zur Registerkarte Daten am oberen Rand von Excel und klicken Sie auf Datenanalyse.

Datenanalyse-Toolpak in Excel

Wenn diese Option nicht angezeigt wird, müssen Sie zuerst das kostenlose Datenanalyse-Toolpak in Excel laden.

Wählen Sie im neuen Fenster die Option Correlation und klicken Sie auf OK.

Korrelationsmatrix mit Datenanalyse-Toolpak in Excel

Wählen Sie als Eingabebereich die Zellen aus, in denen sich die Daten befinden (einschließlich der ersten Zeile mit den Beschriftungen). Aktivieren Sie das Kontrollkästchen neben Labels in First Row. Wählen Sie als Ausgabebereich eine Zelle aus, in der die Korrelationsmatrix angezeigt werden soll. Klicken Sie dann auf OK.

Korrelationsmatrix in Excel

Dadurch wird automatisch die folgende Korrelationsmatrix erstellt:

Ausgabe der Korrelationsmatrix in Excel

Interpretieren einer Korrelationsmatrix in Excel

Die Werte in den einzelnen Zellen der Korrelationsmatrix geben den Pearson-Korrelationskoeffizienten zwischen jeder paarweisen Kombination von Variablen an. Beispielsweise:

Korrelation zwischen Punkten und Rebounds: -0.04639. Punkte und Rebounds sind leicht negativ korreliert, aber dieser Wert liegt so nahe bei Null, dass es keine eindeutigen Hinweise auf eine signifikante Assoziation zwischen diesen beiden Variablen gibt.

Korrelation zwischen Punkten und Assists: 0.121871. Punkte und Vorlagen sind leicht positiv korreliert, aber dieser Wert liegt auch ziemlich nahe bei Null, sodass es keine eindeutigen Hinweise auf eine signifikante Assoziation zwischen diesen beiden Variablen gibt.

Korrelation zwischen Rebounds und Assists: 0.713713. Rebounds und Assists sind stark positiv korreliert. Das heißt, Spieler mit mehr Rebounds haben tendenziell auch mehr Assists.

Beachten Sie, dass die Diagonalwerte in der Korrelationsmatrix alle gleich 1 sind, da die Korrelation zwischen einer Variablen und sich selbst immer 1 ist. In der Praxis ist diese Zahl für die Interpretation nicht nützlich.

Bonus: Visualisierung von Korrelationskoeffizienten

Eine einfache Möglichkeit, den Wert der Korrelationskoeffizienten in der Tabelle zu visualisieren, besteht darin, die bedingte Formatierung auf die Tabelle anzuwenden. Entlang der oberen Band in Excel finden Sie auf der Registerkarte Start, dann die Gruppe Stilarten. Klicken Sie auf Bedingtes Formatierung, dann auf Farbskalen und dann auf die Grün-Gelb-RotFarbskala.

Dadurch wird automatisch die folgende Farbskala auf die Korrelationsmatrix angewendet:

Korrelationsmatrix mit bedingter Formatierung in Excel

Dies hilft uns, die Stärke der Korrelationen zwischen den Variablen leicht zu visualisieren. Dies ist ein besonders hilfreicher Trick, wenn wir mit einer Korrelationsmatrix arbeiten, die viele Variablen enthält, da wir so die Variablen mit den stärksten Korrelationen schnell identifizieren können.

Statistik in Excel leicht gemacht

"Statistik in Excel leicht gemacht" ist eine Sammlung von 16 Excel-Tabellen, die integrierte Formeln enthalten, um die wichtigsten statistischen Tests und Funktionen durchzuführen.

Statistik in Excel leicht gemacht

Das könnte Sie auch interessieren:
R

Kurvenanpassung in R (mit Beispielen)

Oft möchte man die Gleichung finden, die am besten zu einer Kurve in R passt.

Kurvenanpassung in R

Das folgende Schritt-für-Schritt-Beispiel erklärt, wie man in R mit der Funktion poly() Kurven an Daten …