Kovarianzmatrix in R erstellen

Von Fabian
Kategorie: R
Lesezeit: 3 Minuten

    Die Kovarianz ist ein Maß dafür, wie Änderungen in einer Variablen mit Änderungen in einer zweiten Variablen verbunden sind. Insbesondere ist dies ein Maß für den Grad, in dem zwei Variablen linear miteinander verbunden sind.

    Eine Kovarianzmatrix ist eine quadratische Matrix, die die Kovarianz zwischen vielen verschiedenen Variablen zeigt. Dies kann eine nützliche Methode sein, um zu verstehen, wie verschiedene Variablen in einem Dataset zusammenhängen.

    Das folgende Beispiel zeigt, wie eine Kovarianzmatrix in R erstellt wird.

    o erstellen Sie eine Kovarianzmatrix in R**

    Verwenden Sie die folgenden Schritte, um eine Kovarianzmatrix in R zu erstellen.

    Schritt 1: Erstellen Sie das Dataframe.

    Zunächst erstellen wir ein Dataframe, der die Testergebnisse von 10 verschiedenen Schülern für drei Fächer enthält: Mathematik, Naturwissenschaften und Geschichte.

    #Dataframe erstellen
    data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                       science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                       history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))
    
    #Dataframe anzeigen
    data
    
       math science history
    1    84      85      97
    2    82      82      94
    3    81      72      93
    4    89      77      95
    5    73      75      88
    6    94      89      82
    7    92      95      78
    8    70      84      84
    9    88      77      69
    10   95      94      78
    

    Schritt 2: Erstellen Sie die Kovarianzmatrix.

    Als Nächstes erstellen wir die Kovarianzmatrix für diesen Datensatz mit der Funktion cov():

    #Kovarianzmatrix erstellen
    cov(data)
    
                 math   science   history
    math     72.17778  36.88889 -27.15556
    science  36.88889  62.66667 -26.77778
    history -27.15556 -26.77778  83.95556
    

    Schritt 3: Interpretieren Sie die Kovarianzmatrix.

    Die Werte entlang der Diagonalen der Matrix sind einfach die Varianzen jedes Subjekts. Beispielsweise:

    • Die Varianz der mathematischen Ergebnisse beträgt 72,18
    • Die Varianz der wissenschaftlichen Ergebnisse beträgt 62,67
    • Die Varianz der Verlaufswerte beträgt 83,96

    Die anderen Werte in der Matrix repräsentieren die Kovarianzen zwischen den verschiedenen Subjekten. Beispielsweise:

    • Die Kovarianz zwischen den Ergebnissen für Mathematik und Naturwissenschaften beträgt 36,89
    • Die Kovarianz zwischen den Ergebnissen für Mathematik und Geschichte beträgt -27,16
    • Die Kovarianz zwischen den Ergebnissen für Wissenschaft und Geschichte beträgt -26,78

    Eine positive Zahl für die Kovarianz zeigt an, dass zwei Variablen dazu neigen, im Tandem zuzunehmen oder abzunehmen. Zum Beispiel haben Mathematik und Naturwissenschaften eine positive Kovarianz (36,89), was darauf hinweist, dass Schüler, die in Mathematik hohe Punktzahlen erzielen, auch in Naturwissenschaften tendenziell hohe Punktzahlen erzielen. Umgekehrt tendieren Schüler, die in Mathematik schlecht abschneiden, auch dazu, in Naturwissenschaften schlecht abzuschneiden.

    Eine negative Zahl für die Kovarianz zeigt an, dass eine zweite Variable mit zunehmender einer Variablen tendenziell abnimmt. Zum Beispiel haben Mathematik und Geschichte eine negative Kovarianz (-27,16), was darauf hinweist, dass Schüler, die in Mathematik eine hohe Punktzahl erzielen, in der Geschichte tendenziell eine niedrige Punktzahl erzielen. Umgekehrt neigen Schüler, die in Mathematik schlecht abschneiden, dazu, in der Geschichte hoch zu punkten.

    Weitere R-Tutorials finden Sie hier.

    Statistik: Der Weg zur Datenanalyse

    * Amazon Affiliate Link


    Das könnte Sie auch interessieren: