Wenn wir eine einfache lineare Regression durchführen, sind wir häufig daran interessiert, ein Streudiagramm zu erstellen, um die verschiedenen Kombinationen von x- und y-Werten zu visualisieren.

    Glücklicherweise macht es R einfach, Streudiagramme mit der Funktion plot() zu erstellen. Beispielsweise:

    #Synthetische Daten generieren
    data <- data.frame(x = c(1, 1, 2, 3, 4, 4, 5, 6, 7, 7, 8, 9, 10, 11, 11),
                       y = c(13, 14, 17, 12, 23, 24, 25, 25, 24, 28, 32, 33, 35, 40, 41))
    
    #Streudiagramm erstellen
    plot(data$x, data$y)
    

    Streudiagramm in R

    Es ist auch einfach, mit der Funktion abline() eine Regressionslinie zum Streudiagramm hinzuzufügen. Beispielsweise:

    #Lineares Regressionsmodell anpassen
    model <- lm(y ~ x, data = data)
    
    #angepassten Regressionslinie zum Streudiagramm hinzufügen
    abline(model)
    

    Streudiagramm mit Regressionslinie in R

    Wir können dem Plot auch Konfidenzintervalllinien hinzufügen, indem wir die Funktion predict() verwenden. Beispielsweise:

    #X-Wertebereich definieren
    newx = seq(min(data$x),max(data$x),by = 1)
    
    #95% Konfidenzniveau für den X-Wertebereich finden
    conf_interval <- predict(model, newdata=data.frame(x=newx), interval="confidence",
                             level = 0.95)
    
    #Streudiagramm mit den Werten der Regressionslinie erstellen
    plot(data$x, data$y)
    abline(model)
    
    #Gestrichelte Linie (lty=2) für das 95% Konfidenzniveau hinzufügen
    lines(newx, conf_interval[,2], col="blue", lty=2)
    lines(newx, conf_interval[,3], col="blue", lty=2)
    

    Regressionsgerade mit Konfidenzintervall in R

    Oder wir können dem Diagramm stattdessen Vorhersageintervalllinien hinzufügen, indem wir den Intervalltyp in der Funktion predict() angeben. Beispielsweise:

    #X-Wertebereich definieren
    newx = seq(min(data$x),max(data$x),by = 1)
    
    #95% Konfidenzniveau für den X-Wertebereich finden
    pred_interval <- predict(model, newdata=data.frame(x=newx), interval="prediction",
                             level = 0.95)
    
    #Streudiagramm mit den Werten der Regressionslinie erstellen
    plot(data$x, data$y)
    abline(model)
    
    #Gestrichelte Linie (lty=2) für das 95% Konfidenzniveau hinzufügen
    lines(newx, pred_interval[,2], col="red", lty=2)
    lines(newx, pred_interval[,3], col="red", lty=2)
    

    Regressionslinie mit Vorhersageintervalllinien in R

    Schließlich können wir das Diagramm ästhetischer gestalten, indem wir einen Titel hinzufügen, die Achsnamen ändern und die Form der einzelnen Punkte im Diagramm ändern.

    plot(data$x, data$y,
         main = "Scatterplot of x vs. y", #Titel hinzufügen
         pch=16, #Punkte angeben, die ausgefüllt werden
         xlab='x', #x-Achenstitel ändern
         ylab='y') #y-Achenstitel ändern
    
    abline(model, col='steelblue') #specify color of regression line
    

    Regressionsgerade mit Streudiagramm in R

    Ähnliche Artikel:
    Verwendung der Jitter-Funktion in R für Streudiagramme
    So erstellen und ändern Sie Streudiagramme in SPSS
    So erstellen Sie ein Streudiagramm mit einer Regressionslinie in R

    Statistik: Der Weg zur Datenanalyse

    * Amazon Affiliate Link


    Das könnte Sie auch interessieren: