CDF vs. PDF: Was ist der Unterschied?

Dieses Tutorial bietet eine einfache Erklärung des Unterschieds zwischen einer PDF-Funktion (Wahrscheinlichkeitsdichtefunktion) und einer CDF-Funktion (kumulative Dichtefunktion) in der Statistik.

PDF: Probability Density Function
CDF: Cumulative Distribution Function

Zufällige Variablen

Bevor wir ein PDF oder eine CDF definieren können, müssen wir zunächst Zufallsvariablen verstehen.

Eine Zufallsvariable, die normalerweise als X bezeichnet wird, ist eine Variable, deren Werte numerische Ergebnisse eines zufälligen Prozesses sind. Es gibt zwei Arten von Zufallsvariablen: diskret und kontinuierlich.

Diskrete Zufallsvariablen

Eine diskrete Zufallsvariable ist eine Variable, die nur eine zählbare Anzahl unterschiedlicher Werte wie 0, 1, 2, 3, 4, 5… 100, 1 Million usw. annehmen kann. Einige Beispiele für diskrete Zufallsvariablen umfassen:

Die Häufigkeit, mit der eine Münze nach 20-maligem Umwerfen auf landet landet.
Die Häufigkeit, mit der ein Würfel auf der Zahl 4 landet, nachdem er 100 Mal gewürfelt wurde.

Kontinuierliche Zufallsvariablen

Eine kontinuierliche Zufallsvariable kann unendlich viele mögliche Werte annehmen. Einige Beispiele für kontinuierliche Zufallsvariablen sind:

Größe einer Person
Gewicht eines Tieres
Zeitaufwand für eine Meile

Zum Beispiel könnte die Größe einer Person 60,2 Zoll, 65,2344 Zoll, 70,431222 Zoll usw. betragen. Es gibt unendlich viele mögliche Werte für die Größe.

Daumenregel: Wenn Sie die Anzahl der Ergebnisse zählen können, dann sind Sie mit einer diskreten Zufallsvariablen arbeiten (z.B. Zählen der Anzahl, wie oft eine Münze landet auf Köpfe). Wenn Sie das Ergebnis messen können, arbeiten Sie mit einer kontinuierlichen Zufallsvariablen (z. B. Messung, Größe, Gewicht, Zeit usw.).

Wahrscheinlichkeitsdichtefunktionen

Eine Wahrscheinlichkeitsdichtefunktion (PDF) gibt die Wahrscheinlichkeit an, mit der eine Zufallsvariable einen bestimmten Wert annimmt.

Nehmen wir zum Beispiel an, wir würfeln einmal. Wenn wir x die Zahl bezeichnen lassen, auf der die Würfel landen, kann die Wahrscheinlichkeitsdichtefunktion für das Ergebnis wie folgt beschrieben werden:

P(x <1): 0

P(x = 1): 1/6

P(x = 2): 1/6

P(x = 3): 1/6

P(x = 4): 1/6

P(x = 5): 1/6

P(x = 6): 1/6

P(x> 6): 0

Beachten Sie, dass dies ein Beispiel für eine diskrete Zufallsvariable ist, da x nur ganzzahlige Werte annehmen kann.

Für eine kontinuierliche Zufallsvariable können wir ein PDF nicht direkt verwenden, da die Wahrscheinlichkeit, dass x einen exakten Wert annimmt, Null ist.

Nehmen wir zum Beispiel an, wir möchten die Wahrscheinlichkeit wissen, dass ein Burger aus einem bestimmten Restaurant ein Viertel Pfund (0,25 Pfund) wiegt. Da das Gewicht eine stetige Variable ist, kann es unendlich viele Werte annehmen. Zum Beispiel könnte ein gegebener Burger tatsächlich 0,250001 Pfund oder 0,24 Pfund oder 0,2488 Pfund wiegen. Die Wahrscheinlichkeit, dass ein bestimmter Burger genau 0,25 Pfund wiegt, ist im Wesentlichen Null.

Kumulative Dichtefunktionen

Eine kumulative Dichtefunktion (CDF) gibt die Wahrscheinlichkeit an, dass eine Zufallsvariable einen Wert kleiner oder gleich x annimmt.

Nehmen wir zum Beispiel an, wir würfeln einmal. Wenn wir x die Zahl bezeichnen lassen, auf der die Würfel landen, kann die kumulative Dichtefunktion für das Ergebnis wie folgt beschrieben werden:

P(x ≤ 0): 0

P(x ≤ 1): 1/6

P(x ≤ 2): 2/6

P(x ≤ 3): 3/6

P(x ≤ 4): 4/6

P(x ≤ 5): 5/6

P(x ≤ 6): 6/6

P(x> 6): 0

Beachten Sie, dass die Wahrscheinlichkeit, dass x kleiner oder gleich 6 ist, 6/6 beträgt, was gleich 1 ist. Dies liegt daran, dass die Würfel mit einer Wahrscheinlichkeit von 100% entweder auf 1, 2, 3, 4, 5 oder 6 landen.

In diesem Beispiel wird eine diskrete Zufallsvariable verwendet, aber eine kontinuierliche Dichtefunktion kann auch für eine kontinuierliche Zufallsvariable verwendet werden.

Kumulative Dichtefunktionen haben die folgenden Eigenschaften:

Die Wahrscheinlichkeit, dass eine Zufallsvariable einen Wert annimmt, der kleiner als der kleinstmögliche Wert ist, ist Null. Zum Beispiel ist die Wahrscheinlichkeit, dass ein Würfel auf einem Wert kleiner als 1 landet, Null.
Die Wahrscheinlichkeit, dass eine Zufallsvariable einen Wert annimmt, der kleiner oder gleich dem größtmöglichen Wert ist, ist eins. Zum Beispiel ist die Wahrscheinlichkeit, dass ein Würfel auf einem Wert von 1, 2, 3, 4, 5 oder 6 landet, eins. Es muss auf einer dieser Zahlen landen.
Das cdf nimmt immer nicht ab. Das heißt, die Wahrscheinlichkeit, dass ein Würfel auf einer Zahl kleiner oder gleich 1 landet, beträgt 1/6, die Wahrscheinlichkeit, dass er auf einer Zahl kleiner oder gleich 2 landet, beträgt 2/6, die Wahrscheinlichkeit, dass er auf einer Zahl landet kleiner oder gleich 3 ist 3/6 usw. Die kumulativen Wahrscheinlichkeiten nehmen immer nicht ab.

Verwandte Themen : Sie können ein Ogiv-Diagramm verwenden, um eine kumulative Dichtefunktion zu visualisieren.

Die Beziehung zwischen einer CDF und einem PDF

In technischer Hinsicht ist eine Wahrscheinlichkeitsdichtefunktion (PDF) die Ableitung einer kumulativen Dichtefunktion (CDF).

Darüber hinaus ist die Fläche unter der Kurve eines PDF zwischen negativer Unendlichkeit und x gleich dem Wert von x auf dem PDF.

Eine ausführliche Erläuterung der Beziehung zwischen einem PDF und einem PDF sowie den Beweis, warum das PDF die Ableitung des PDF ist, finden Sie in einem statistischen Lehrbuch.

Zufällige Variablen

Diskrete Zufallsvariablen

Kontinuierliche Zufallsvariablen

Wahrscheinlichkeitsdichtefunktionen

Kumulative Dichtefunktionen

Die Beziehung zwischen einer CDF und einem PDF

Statistik: Der Weg zur Datenanalyse

Eine Einführung in die hypergeometrische Verteilung

Eine Einführung in die geometrische Verteilung