Ein Konfidenzintervall ist ein Wertebereich, der wahrscheinlich einen Populationsparameter mit einem bestimmten Konfidenzniveau enthält.
In diesem Tutorial wird erläutert, wie Sie ein Konfidenzintervall für ein Dataset in Python mithilfe der Visualisierungsbibliothek seaborn zeichnen.
Zeichnen von Konfidenzintervallen mit lineplot()
Die erste Möglichkeit, ein Konfidenzintervall zu zeichnen, besteht in der Funktion lineplot(), mit der alle Datenpunkte in einem Datensatz mit einer Linie verbunden werden und um jeden Punkt ein Konfidenzband angezeigt wird:
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
#Erstellen Sie einige zufällige Daten
np.random.seed(0)
x = np.random.randint(1, 10, 30)
y = x+np.random.normal(0, 1, 30)
# Lineplot erstellen
ax = sns.lineplot(x, y)
Standardmäßig verwendet die Funktion lineplot() ein Konfidenzintervall von 95%, kann jedoch die Konfidenzstufe angeben, die mit dem Befehl ci verwendet werden soll.
Je kleiner das Konfidenzniveau ist, desto enger ist das Konfidenzintervall um die Linie. So sieht beispielsweise ein 80%-Konfidenzintervall für genau denselben Datensatz aus:
# Lineplot erstellen
ax = sns.lineplot(x, y, ci=80)
Zeichnen von Konfidenzintervallen mit regplot()
Sie können Konfidenzintervalle auch mit der Funktion regplot() zeichnen, die ein Streudiagramm eines Datensatzes mit Konfidenzbändern um die geschätzte Regressionslinie anzeigt:
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
# Erstellen Sie einige zufällige Daten
np.random.seed(0)
x = np.random.randint(1, 10, 30)
y = x+np.random.normal(0, 1, 30)
# Regplot erstellen
ax = sns.regplot(x, y)
Ähnlich wie bei lineplot() verwendet die Funktion regplot() standardmäßig ein Konfidenzintervall von 95%, kann jedoch die Konfidenzstufe angeben, die mit dem Befehl ci verwendet werden soll.
Je kleiner das Konfidenzniveau ist, desto enger ist das Konfidenzintervall um die Regressionslinie. So sieht beispielsweise ein 80%-Konfidenzintervall für genau denselben Datensatz aus:
# Regplot erstellen
ax = sns.regplot (x, y, ci = 80 )
Zusätzliche Ressourcen
Was sind Konfidenzintervalle?
So berechnen Sie Konfidenzintervalle in Python