Eine Anleitung zu dt, qt, pt & rt in R

Von Fabian
Kategorie: R
Lesezeit: 4 Minuten

Die Student t-Verteilung ist eine der am häufigsten verwendeten Verteilungen in der Statistik. In diesem Tutorial wird erklärt, wie Sie mit der Student t-Verteilung in R mithilfe der Funktionen dt(), qt(), pt() und rt() arbeiten.

dt

Die Funktion dt gibt den Wert der Wahrscheinlichkeitsdichtefunktion (PDF) der Student t-Verteilung bei einer bestimmten Zufallsvariablen x und Freiheitsgraden df zurück. Die Syntax für die Verwendung von dt lautet wie folgt:

dt(x, df)

Der folgende Code zeigt einige Beispiele für dt in Aktion:

#Finden Sie den Wert der Student t-Verteilung PDF bei x = 0 mit 20 Freiheitsgraden
dt(x = 0, df = 20)
# [1] 0,3939886

# Standardmäßig geht R davon aus, dass das erste Argument x und das zweite Argument df ist
dt(0, 20)
# [1] 0,3939886

#Finden Sie den Wert der Student t-Verteilung pdf bei x = 1 mit 30 Freiheitsgraden
dt(1, 30)
# [1] 0,2379933

Wenn Sie versuchen, Fragen zur Wahrscheinlichkeit mithilfe der Student t-Verteilung zu lösen, verwenden Sie normalerweise pt anstelle von dt. Eine nützliche Anwendung von dt ist jedoch das Erstellen eines Student t-Verteilungsdiagramms in R Der folgende Code veranschaulicht, wie dies getan wird:

#Erstellen Sie eine Folge von 100 gleich beabstandeten Zahlen zwischen -4 und 4
x <- seq(-4, 4, length=100)
#Erstellen Sie einen Wertevektor, der die Höhe der Wahrscheinlichkeitsverteilung anzeigt
#für jeden Wert in x mit 20 Freiheitsgraden
y <- dt(x = x, df = 20)
#Plotte x und y als Streudiagramm mit verbundenen Linien (Typ = "l") und füge
# eine x-Achse mit benutzerdefinierten Beschriftungen hinzu
plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "")
axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))

Dies erzeugt das folgende Diagramm:

Student t Verteilungsdiagramm in R

pt

Die Funktion pt gibt den Wert der kumulativen Dichtefunktion (cdf) der Student t-Verteilung bei einer bestimmten Zufallsvariablen x und Freiheitsgraden df zurück. Die Syntax für die Verwendung von pnorm lautet wie folgt:

pt(x, df)

Einfach ausgedrückt, gibt pt den Bereich links von einem bestimmten Wert x in der Student t-Verteilung zurück. Wenn Sie sich für den Bereich rechts von einem bestimmten Wert x interessieren, können Sie einfach das Argument lower.tail = FALSE hinzufügen

pt(x, df, lower.tail = FALSE)

Das folgende Beispiel zeigt, wie einige Wahrscheinlichkeitsfragen mit pt gelöst werden.

Beispiel 1: Suchen Sie den Bereich links von einer t-Statistik mit einem Wert von -0,785 und 14 Freiheitsgraden.

pt(-0,785, 14)
# [1] 0,2227675 

Beispiel 2: Finden Sie den Bereich rechts von einer t-Statistik mit einem Wert von -0,785 und 14 Freiheitsgraden.

#Die folgenden Ansätze führen zu gleichwertigen Ergebnissen

# 1 - Bereich links
1 - pt(-0.785, 14)
# [1] 0,7772325

#Bereich rechts
pt(-0,785, 14, lower.tail = FALSE)
# [1] 0,7772325 

Beispiel 3: Ermitteln Sie die Gesamtfläche in einer Student t-Verteilung mit 14 Freiheitsgraden, die links von -0,785 oder rechts von 0,785 liegt.

pt(-0.785, 14) + pt(0.785, 14, lower.tail = FALSE)
# [1] 0,4455351 

qt

Die Funktion qt gibt den Wert der inversen kumulativen Dichtefunktion (CDF) der Student t-Verteilung bei einer bestimmten Zufallsvariablen x und Freiheitsgraden df zurück. Die Syntax für die Verwendung von qt lautet wie folgt:

qt(x, df)

Einfach ausgedrückt, können Sie qt verwenden, um herauszufinden, wie hoch der t-Score des p-ten Quantils der Student t-Verteilung ist.

Der folgende Code zeigt einige Beispiele für qt in Aktion:

#Finden Sie den t-Score des 99. Quantils der Student t-Verteilung mit df = 20
qt(.99, df = 20)
# [1] [1] 2.527977 

#Finden Sie den t-Score des 95. Quantils der Student t-Verteilung mit df = 20
qt(.95, df = 20)
# [1] 1.724718

#Finden Sie den t-Score des 90. Quantils der Student t-Verteilung mit df = 20
qt(.9, df = 20)
# [1] 1.325341

Beachten Sie, dass die von qt gefundenen kritischen Werte mit den in der t-Verteilungstabelle gefundenen kritischen Werten sowie den kritischen Werten übereinstimmen.

rt

Die Funktion rt erzeugt einen Vektor von Zufallsvariablen, die einer Student t-Verteilung folgen, wenn eine Vektorlänge n und Freiheitsgrade df gegeben sind. Die Syntax für die Verwendung von rt lautet wie folgt:

rt(n, df)

Der folgende Code zeigt einige Beispiele für rt in Aktion:

#Generieren Sie einen Vektor mit 5 Zufallsvariablen, die einer Student t-Verteilung folgen
#mit df = 20
rt(n = 5, df = 20)
# [1] -1,7422445 0,9560782 0,6635823 1,2122289 -0,7052825

#generieren Sie einen Vektor mit 1000 Zufallsvariablen, die einer Student t-Verteilung folgen mit df = 40
narrowDistribution <- rt(1000, 40)

#Generieren Sie einen Vektor mit 1000 Zufallsvariablen, die einer Student t-Verteilung folgen mit df = 5
wideDistribution <- rt(1000, 5)

#Generieren Sie zwei Histogramme, um diese beiden Verteilungen nebeneinander anzuzeigen, und geben Sie 50 Balken im Histogramm an
par(mfrow=c(1, 2)) #eine Zeile, zwei Spalten
hist(narrowDistribution, breaks=50, xlim = c(-6, 4))
hist(wideDistribution, breaks=50, xlim = c(-6, 4))

Dies erzeugt die folgenden Histogramme:

Histogramm der t-Verteilungen

Beachten Sie, dass die weite Verteilung im Vergleich zur engen Verteilung stärker verteilt ist. Dies liegt daran, dass wir die Freiheitsgrade in der breiten Verteilung mit 5 gegenüber 40 in der engen Verteilung angegeben haben. Je weniger Freiheitsgrade vorhanden sind, desto breiter wird die Verteilung der Schüler sein.

Weiterführende Literatur:
Ein Leitfaden zu dbinom, pbinom, qbinom und rbinom in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: