Die Kovarianz ist ein Maß dafür, wie Änderungen in einer Variablen mit Änderungen in einer zweiten Variablen verbunden sind. Insbesondere ist dies ein Maß für den Grad, in dem zwei …
In der Statistik sind wir oft daran interessiert, die Beziehung zwischen zwei Variablen zu verstehen. Zum Beispiel möchten wir vielleicht die Beziehung zwischen der Anzahl der Stunden, die ein Student studiert, und der Prüfungsnote, die er erhält, verstehen.
Eine Möglichkeit, diese Beziehung zu quantifizieren, besteht darin, den Pearson-Korrelationskoeffizienten zu verwenden, der ein Maß für die lineare Assoziation zwischen zwei Variablen ist . Es hat einen Wert zwischen -1 und 1, wobei:
- -1 zeigt eine vollkommen negative lineare Korrelation zwischen zwei Variablen an
- 0 zeigt keine lineare Korrelation zwischen zwei Variablen an
- 1 zeigt eine vollkommen positive lineare Korrelation zwischen zwei Variablen an
Je weiter der Korrelationskoeffizient von Null entfernt ist, desto stärker ist die Beziehung zwischen den beiden Variablen.
In einigen Fällen möchten wir jedoch die Korrelation zwischen mehr als nur einem Variablenpaar verstehen. In diesen Fällen können wir eine Korrelationsmatrix erstellen, bei der es sich um eine quadratische Tabelle handelt, die die Korrelationskoeffizienten zwischen mehreren paarweisen Kombinationen von Variablen zeigt.
In diesem Tutorial erklären wir, wie eine Korrelationsmatrix in Stata erstellt wird.
So erstellen Sie eine Korrelationsmatrix in Stata
Mit dem Befehl corr kann eine Korrelationsmatrix für einen bestimmten Datensatz in Stata erstellt werden.
Um dies zu veranschaulichen, laden wir die Volkszählungsdaten von 1980 in Stata, indem wir Folgendes in das Befehlsfeld eingeben:
use http://www.stata-press.com/data/r13/census13
Wir können dann eine kurze Zusammenfassung des Datensatzes erhalten, indem wir Folgendes in das Befehlsfeld eingeben:
summarize
Dies ergibt die folgende Tabelle:
Wir sehen, dass der Datensatz neun verschiedene Variablen enthält. Um eine Korrelationsmatrix für jede paarweise Kombination von Variablen im Datensatz zu erstellen, können Sie Folgendes in das Befehlsfeld eingeben:
corr
Dies erzeugt die folgende Korrelationsmatrix:
Die in der Tabelle angegebenen Zahlen repräsentieren die Pearson-Korrelationskoeffizienten für jede paarweise Kombination von Variablen. Beispielsweise beträgt die Korrelation zwischen Pop und State -0,0540. Dies zeigt an, dass diese beiden Variablen leicht negativ korreliert sind.
Beachten Sie, dass die Korrelation entlang der Diagonalen der Tabelle jeweils 1,0000 beträgt, da jede Variable perfekt mit sich selbst korreliert.
Sie können auch eine Korrelationsmatrix nur für eine bestimmte Teilmenge von Variablen in einem Dataset erstellen, indem Sie die Variablen nach dem Befehl corr angeben. So können Sie beispielweise eine Korrelationsmatrix nur für die Variablen pop, medage und region erstellen :
corr pop medage region
Dies erzeugt die folgende Korrelationsmatrix nur für diese drei Variablen:
Es ist auch möglich, einen Stern neben die Korrelationskoeffizienten zu setzen, die bei einem bestimmten Signifikanzniveau statistisch signifikant sind, indem der Befehl pwcorr (der das gleiche Ergebnis wie corr erzeug ) zusammen mit dem Befehl star() verwendet wird.
Der folgende Code erstellt beispielsweise eine Korrelationsmatrix für jede Variable im Volkszählungsdatensatz und platziert einen Stern neben den Korrelationskoeffizienten, die bei α = 0,05 statistisch signifikant sind:
pwcorr, star(.05)
Beachten Sie, wie viele der Korrelationskoeffizienten in der Tabelle bei α = 0,05 statistisch signifikant sind. Wir könnten α auf eine beliebige Zahl setzen, die wir möchten, aber die gängigen Optionen sind .01, .05 und .10.
Je niedriger wir den Wert von α einstellen, desto weniger Korrelationskoeffizienten sind im Allgemeinen statistisch signifikant. Nehmen wir zum Beispiel an, wir setzen α = 0,01.
pwcorr, star(.01)
Beachten Sie, wie weniger Korrelationskoeffizienten einen Stern neben sich haben.
So erstellen Sie eine Kovarianzmatrix in SPSS
Berechnen der partiellen Korrelation in SPSS
In der Statistik verwenden wir häufig den Pearson-Korrelationskoeffizienten, um die lineare Beziehung zwischen zwei Variablen zu messen.
Manchmal sind wir jedoch daran interessiert, die Beziehung zwischen zwei Variablen zu verstehen …