Berkson's Paradoxon: Definition + Beispiele

Von Fabian
Kategorie: Grundlegendes
Lesezeit: 3 Minuten

Berkson's Paradoxon ist eine Art von Verzerrung, die in der Forschung auftritt, wenn zwei Variablen in Stichprobendaten negativ korreliert zu sein scheinen, aber in der gesamten Bevölkerung tatsächlich positiv korreliert sind.

Angenommen, Tom möchte die Korrelation zwischen der Qualität von Burgern und der Qualität von Milchshakes in lokalen Restaurants untersuchen.

Er geht los und sammelt die folgenden Daten über sieben verschiedene Restaurants:

Berkson

Er erstellt einen Scatterplot zur Visualisierung der Daten:

Beispiel für das Berksonsche Paradoxon

Der Pearson-Korrelationskoeffizient zwischen diesen beiden Variablen beträgt -0,75, was eine starke negative Korrelation darstellt.

Dieses Ergebnis ist für Tom kontraintuitiv - er würde denken, dass Restaurants, die gute Burger machen, auch gute Milchshakes machen.

Es stellt sich jedoch heraus, dass Tom einfach alle Restaurants in der Stadt übersprungen hat, die sowohl schlechte Burger als auch schlechte Milchshakes machen.

Wenn er diese Restaurants besucht hätte, hätte er den folgenden Datensatz gesammelt:

Berkson

Und so sieht ein Scatterplot für diesen Datensatz aus:

Berkson

Der Pearson-Korrelationskoeffizient zwischen den beiden Variablen beträgt 0,46, was eine mäßig starke positive Korrelation darstellt.

Indem er nur eine Teilmenge der Restaurants in der Stadt betrachtete, kam Tom fälschlicherweise zu dem Schluss, dass es eine negative Korrelation zwischen der Qualität der Burger und der Qualität der Milchshakes gibt.

In Wirklichkeit stellt sich heraus, dass es eine positive Beziehung (wie man erwarten würde) zwischen diesen beiden Variablen gibt. Dies ist ein klassisches Beispiel für das Berkson Paradoxon.

Sehen Sie sich die folgenden Beispiele für weitere Szenarien an, in denen das Berkson Paradoxon in der Praxis auftritt.

Beispiel 1: Hochschulzulassung

Angenommen, ein College nimmt nur Studenten auf, die einen ausreichend hohen GPA und einen ausreichend hohen ACT-Wert haben.

Es ist bekannt, dass diese beiden Variablen positiv korreliert sind, aber es stellt sich heraus, dass unter den Studenten, die sich für ein bestimmtes College entscheiden, eine negative Korrelation zwischen den beiden Variablen zu bestehen scheint.

Diese negative Korrelation tritt jedoch nur auf, weil die Studenten, die beide einen hohen GPA und ACT-Punktestand haben, an eine Eliteuniversität gehen können, während Studenten, die beide einen niedrigen GPA und ACT-Punktestand haben, überhaupt nicht zugelassen werden.

Berkson

Obwohl die Korrelation zwischen ACT und GPA in der Grundgesamtheit positiv ist, scheint die Korrelation in der Stichprobe negativ zu sein. Dies ist ein Fall von Berkson's Paradoxon.

Beispiel 2: Dating-Präferenzen

Viele Menschen gehen nur mit Partnern aus, die sowohl attraktiv sind als auch eine gute Persönlichkeit haben.

In der realen Welt gibt es vielleicht überhaupt keine Korrelation zwischen diesen beiden Variablen, aber bei der Eingrenzung des Dating-Pools kann eine Person potenzielle Partner, die sowohl unattraktiv sind als auch eine gute Persönlichkeit haben, komplett ignorieren.

Daher kann es bei den potenziellen Partnern so aussehen, als gäbe es eine negative Korrelation zwischen diesen beiden Variablen: Attraktivere Menschen haben eine schlechtere Persönlichkeit und Menschen mit besserer Persönlichkeit scheinen weniger attraktiv zu sein.

Berkson's bias

Obwohl es in der Bevölkerung keine Korrelation zwischen diesen beiden Variablen gibt, scheint es in der Stichprobe der potenziellen Partner eine negative Korrelation zu geben. Dies ist einfach ein Fall von Berkson's Paradoxon.

Verhinderung des Berkson's Paradoxon

Die naheliegendste Methode zur Vermeidung des Berkson's Paradoxon in Forschungsstudien besteht darin, eine einfache Zufallsstichprobe aus einer Population zu ziehen. Das heißt, man muss sicherstellen, dass jedes Mitglied der interessierenden Population die gleiche Chance hat, in die Stichprobe aufgenommen zu werden.

Wenn Sie zum Beispiel die Prävalenz von Krankheiten in einem bestimmten Land untersuchen, sollten Sie eine Stichprobe von Personen aus dem ganzen Land nehmen, nicht nur von denjenigen, die in Krankenhäusern gut zu erreichen sind.

Durch die Verwendung einer einfachen Zufallsstichprobe können Forscher die Wahrscheinlichkeit maximieren, dass ihre Stichprobe repräsentativ für die Bevölkerung ist, was bedeutet, dass sie ihre Ergebnisse aus der Stichprobe mit Sicherheit auf die Gesamtbevölkerung verallgemeinern können.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: