Wenn Sie eine einfache lineare Regression durchführen, möchten Sie häufig ein Streudiagramm erstellen, um die verschiedenen Kombinationen von x- und y-Werten zusammen mit der Schätzungsregressionslinie zu visualisieren.

Glücklicherweise gibt es zwei einfache Möglichkeiten, um diese Art von Plot in Python zu erstellen. In diesem Tutorial werden beide Methoden anhand der folgenden Daten erläutert:

import numpy as np 

# Daten erstellen
x = np.array([1, 1, 2, 3, 4, 4, 5, 6, 7, 7, 8, 9])
y = np.array([13, 14, 17, 12, 23, 24, 25, 25, 24, 28, 32, 33])

Methode 1: Verwenden von Matplotlib

Der folgende Code zeigt, wie mit Matplotlib ein Streudiagramm mit einer geschätzten Regressionslinie für diese Daten erstellt wird:

import matplotlib.pyplot as plt

# Grundlegendes Streudiagramm erstellen
plt.plot(x, y, 'o')

# Erhalten Sie m (Steigung) und b (Achsenabschnitt) der linearen Regressionslinie
m, b = np.polyfit(x, y, 1)

# Lineare Regressionslinie zum Streudiagramm hinzufügen 
plt.plot(x, m*x+b)

Streudiagramm mit Regressionslinie in Python

Sie können die Farben des Diagramms beliebig ändern. So ändern Sie beispielsweise die einzelnen Punkte in Grün und die Linie in Rot:

# Verwenden Sie Grün als Farbe für einzelne Punkte
plt.plot(x, y, 'o', color='green')

# Erhalten Sie m (Steigung) und b (Achsenabschnitt) der linearen Regressionslinie
m, b = np.polyfit(x, y, 1)

# Verwenden Sie Rot als Farbe für die Regressionslinie
plt.plot(x, m*x+b, color='red')

Streudiagramm mit Regressionslinie in Numpy

Methode 2: Verwenden von Seaborn

Sie können auch die Funktion regplot() aus der Seaborn-Visualisierungsbibliothek verwenden, um ein Streudiagramm mit einer Regressionslinie zu erstellen:

import seaborn as sns

# Streudiagramm mit Regressionslinie erstellen
sns.regplot(x, y, ci=None)

Streudiagramm mit Regressionslinie in Seaborn Python

Beachten Sie, dass ci=None Seaborn anweist, die Konfidenzintervallbänder im Plot auszublenden. Sie können sie jedoch anzeigen, wenn Sie möchten:

import seaborn as sns

# Streudiagramm mit Regressionsgeraden und Konfidenzintervalllinien erstellen
sns.regplot(x, y, ci=None)

Scatterregressionpython

Die vollständige Dokumentation zur Funktion regplot() finden Sie hier.

Verwandt: So erstellen Sie ein Streudiagramm mit einer Regressionslinie in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: