So erstellen Sie eine Korrelationsmatrix in Stata

Von Fabian
Kategorie: STATA
Tags: Korrelation
Lesezeit: 3 Minuten

In der Statistik sind wir oft daran interessiert, die Beziehung zwischen zwei Variablen zu verstehen. Zum Beispiel möchten wir vielleicht die Beziehung zwischen der Anzahl der Stunden, die ein Student studiert, und der Prüfungsnote, die er erhält, verstehen.

Eine Möglichkeit, diese Beziehung zu quantifizieren, besteht darin, den Pearson-Korrelationskoeffizienten zu verwenden, der ein Maß für die lineare Assoziation zwischen zwei Variablen ist . Es hat einen Wert zwischen -1 und 1, wobei:

  • -1 zeigt eine vollkommen negative lineare Korrelation zwischen zwei Variablen an
  • 0 zeigt keine lineare Korrelation zwischen zwei Variablen an
  • 1 zeigt eine vollkommen positive lineare Korrelation zwischen zwei Variablen an

Je weiter der Korrelationskoeffizient von Null entfernt ist, desto stärker ist die Beziehung zwischen den beiden Variablen.

In einigen Fällen möchten wir jedoch die Korrelation zwischen mehr als nur einem Variablenpaar verstehen. In diesen Fällen können wir eine Korrelationsmatrix erstellen, bei der es sich um eine quadratische Tabelle handelt, die die Korrelationskoeffizienten zwischen mehreren paarweisen Kombinationen von Variablen zeigt.

In diesem Tutorial erklären wir, wie eine Korrelationsmatrix in Stata erstellt wird.

So erstellen Sie eine Korrelationsmatrix in Stata

Mit dem Befehl corr kann eine Korrelationsmatrix für einen bestimmten Datensatz in Stata erstellt werden.

Um dies zu veranschaulichen, laden wir die Volkszählungsdaten von 1980 in Stata, indem wir Folgendes in das Befehlsfeld eingeben:

use http://www.stata-press.com/data/r13/census13

Wir können dann eine kurze Zusammenfassung des Datensatzes erhalten, indem wir Folgendes in das Befehlsfeld eingeben:

summarize

Dies ergibt die folgende Tabelle:

Korrelationsmatrix in Stata

Wir sehen, dass der Datensatz neun verschiedene Variablen enthält. Um eine Korrelationsmatrix für jede paarweise Kombination von Variablen im Datensatz zu erstellen, können Sie Folgendes in das Befehlsfeld eingeben:

corr

Dies erzeugt die folgende Korrelationsmatrix:

Beispiel einer Korrelationsmatrix in Stata

Die in der Tabelle angegebenen Zahlen repräsentieren die Pearson-Korrelationskoeffizienten für jede paarweise Kombination von Variablen. Beispielsweise beträgt die Korrelation zwischen Pop und State -0,0540. Dies zeigt an, dass diese beiden Variablen leicht negativ korreliert sind.

Beachten Sie, dass die Korrelation entlang der Diagonalen der Tabelle jeweils 1,0000 beträgt, da jede Variable perfekt mit sich selbst korreliert.

Sie können auch eine Korrelationsmatrix nur für eine bestimmte Teilmenge von Variablen in einem Dataset erstellen, indem Sie die Variablen nach dem Befehl corr angeben. So können Sie beispielweise eine Korrelationsmatrix nur für die Variablen pop, medage und region erstellen :

corr pop medage region

Dies erzeugt die folgende Korrelationsmatrix nur für diese drei Variablen:

Beispiel für eine Korrelationsmatrix in Stata

Es ist auch möglich, einen Stern neben die Korrelationskoeffizienten zu setzen, die bei einem bestimmten Signifikanzniveau statistisch signifikant sind, indem der Befehl pwcorr (der das gleiche Ergebnis wie corr erzeug ) zusammen mit dem Befehl star() verwendet wird.

Der folgende Code erstellt beispielsweise eine Korrelationsmatrix für jede Variable im Volkszählungsdatensatz und platziert einen Stern neben den Korrelationskoeffizienten, die bei α = 0,05 statistisch signifikant sind:

pwcorr, star(.05)

Korrelationsmatrix mit statistischer Signifikanz in Stata

Beachten Sie, wie viele der Korrelationskoeffizienten in der Tabelle bei α = 0,05 statistisch signifikant sind. Wir könnten α auf eine beliebige Zahl setzen, die wir möchten, aber die gängigen Optionen sind .01, .05 und .10.

Je niedriger wir den Wert von α einstellen, desto weniger Korrelationskoeffizienten sind im Allgemeinen statistisch signifikant. Nehmen wir zum Beispiel an, wir setzen α = 0,01.

pwcorr, star(.01)

Korrelationsmatrix in Stata

Beachten Sie, wie weniger Korrelationskoeffizienten einen Stern neben sich haben.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: