Untererfassung-Verzerrung ist die Verzerrung, die auftritt, wenn einige Mitglieder einer Population in der Stichprobe unzureichend vertreten sind.
Diese Art von Verzerrung tritt häufig bei willkürlichen Stichproben auf, bei denen man …
Schweige-Verzerrung (engl. nonresponse bias) ist die Verzerrung, die auftritt, wenn die Personen, die auf eine Umfrage antworten, sich signifikant von den Personen unterscheiden, die nicht auf die Umfrage antworten.
Schweige-Verzerrung kann aus mehreren Gründen auftreten:
Schweige-Verzerrung kann aus all diesen Gründen auftreten.
Schweige-Verzerrung ist vor allem aus zwei Gründen ein Problem:
1. Schweige-Verzerrung führt dazu, dass die Stichprobe nicht repräsentativ für die Gesamtbevölkerung ist. Der Sinn der Datenerhebung für eine Stichprobe besteht darin, dass sie schneller und billiger ist als die Datenerhebung für die gesamte Bevölkerung und dass die Ergebnisse der Stichprobe auf die Gesamtbevölkerung extrapoliert werden können.
Um die Ergebnisse extrapolieren zu können, muss die Stichprobe jedoch repräsentativ für unsere Grundgesamtheit sein. Idealerweise sollte unsere Stichprobe eine "Mini"-Version der Grundgesamtheit sein.
Leider kann die Nonresponse-Verzerrung dazu führen, dass sich die Personen in unserer Stichprobe erheblich von den Personen in der Grundgesamtheit unterscheiden.
Angenommen, eine Stadt erwägt den Bau einer neuen Kletteranlage. Um herauszufinden, wie groß das Interesse der Stadtbevölkerung an einer solchen Anlage ist, verschickt die Stadtverwaltung eine kurze Umfrage über eine neue Smartphone-App.
Aufgrund der Methode, mit der die Umfrage durchgeführt wurde, und wegen des Inhalts der Umfrage (Fragen zum Klettern) antworten vor allem junge Menschen, die die App haben und sich für das Klettern interessieren.
Das Ergebnis der Umfrage zeigt also, dass eine überwältigende Mehrheit der Stadtbevölkerung am Bau dieser neuen Anlage interessiert ist. Leider sind die Ergebnisse der Umfrage nicht repräsentativ für die Gesamtbevölkerung.
Die folgende Grafik veranschaulicht dieses Problem: Nehmen wir an, die grünen Kreise stehen für Personen, die an der Nutzung der Einrichtung interessiert sind, während die roten Kreise für Personen stehen, die kein Interesse an der Nutzung der Einrichtung haben:
Beachten Sie, dass die Stichprobe nicht repräsentativ für die Grundgesamtheit ist. Die Ergebnisse der Umfrage würden zeigen, dass die meisten Menschen von einer neuen Kletteranlage begeistert sind. Wenn die Stadtverwaltung davon ausgeht, dass diese Stichprobe repräsentativ für die Bevölkerung ist, könnte sie leider beschließen, die Anlage zu bauen, und dann schnell feststellen, dass viel weniger Menschen sie nutzen würden, als sie dachten.
2. Schweige-Verzerrung kann zu einer größeren Varianz der Schätzungen führen. Wenn sich herausstellt, dass die Stichprobengröße der Erhebung kleiner ist als die von den Forschern geplante, kann die Varianz der Schätzungen der Studie größer sein als geplant.
AusHypothesentests wissen wir zum Beispiel, dass die Varianz unserer Schätzung für einen Populationsmittelwert oder einen Populationsanteil umso geringer ist, je größer unsere Stichprobe ist. Je kleiner jedoch die Stichprobe ist, desto höher ist die Varianz der Schätzungen für die Parameter der Grundgesamtheit, und desto schwieriger ist es, ein statistisch signifikantes Ergebnis zu finden.
Die folgenden Beispiele illustrieren mehrere Fälle, in denen Schweige-Verzerrung auftreten kann.
Forscher wollen wissen, wie Informatiker ein neues Softwareprogramm wahrnehmen. Da sie möglichst viele Daten aus der Umfrage erhalten wollen, entwerfen die Forscher eine Umfrage, die etwa eine Stunde dauert. Als sie die Umfrage verteilen, stellen sie fest, dass viele Informatiker entweder gar nicht antworten oder sie beginnen zu antworten, brechen aber schließlich ab, bevor sie die gesamte Umfrage ausgefüllt haben.
Wenn die Forscher die Daten zurückerhalten, stellen sie fest, dass die Befragten die Software als ausgezeichnet und hochwertig empfinden. Wenn sie die neue Software jedoch an alle Informatiker weitergeben, erhalten sie überwiegend negative Rückmeldungen.
Es stellt sich heraus, dass die Leute, die sich die Zeit genommen haben, die gesamte Umfrage auszufüllen, zum größten Teil Informatikanfänger sind, die nicht in der Lage sind, die Mängel des Programms zu beurteilen.
Deshalb spiegelten die Teilnehmer der Umfrage nicht die gesamte Population der Informatiker wider, und die Ergebnisse der Umfrage waren daher unzuverlässig.
Forscher wollen etwas über den Alkoholkonsum an einer bestimmten Hochschule erfahren. Sie beschließen, auf dem Campus einen Stand einzurichten, an dem die Studenten einen Fragebogen ausfüllen können, in dem sie angeben, wie viel und wie oft sie Alkohol konsumieren. Leider ist der Fragebogen nicht anonym, so dass nur Studenten, die wenig oder gar keinen Alkohol trinken, den Fragebogen ausfüllen.
Aus den Ergebnissen geht hervor, dass der Alkoholkonsum unter den Schülern gering und selten ist. Leider spiegeln die Teilnehmer der Umfrage nicht die Gesamtheit der Studenten auf dem Campus wider, so dass die Ergebnisse unzuverlässig sind.
Ein klassisches Beispiel für Schweige-Verzerrung ist die Präsidentschaftswahl von 1936. Eine populäre Publikation führte damals eine Umfrage durch, die Alf Landon einen erdrutschartigen Sieg über Franklin D. Roosevelt voraussagte. Als die Wahl jedoch stattfand, gewann Franklin D. Roosevelt tatsächlich mit einem Erdrutschsieg.
Es stellte sich heraus, dass von den 10 Millionen verschickten Fragebögen nur 2,3 Millionen Menschen geantwortet hatten. Die 7,7 Millionen, die nicht antworteten, unterschieden sich erheblich in ihren politischen Präferenzen.
Die Ergebnisse des Fragebogens spiegelten also nicht die Gesamtbevölkerung wider, weshalb sich die Vorhersage, dass Alf Landon gewinnen würde, als so falsch erwies.
Schweige-Verzerrung kann durch folgende Schritte verhindert (oder zumindest abgeschwächt) werden:
Es ist zwar nicht immer möglich, die Auswirkungen der Nonresponse-Verzerrung vollständig zu beseitigen, aber es ist möglich, die Auswirkungen zu minimieren, indem man einen intelligenten Umfrageentwurf und eine intelligente Verteilungsmethode verwendet.
Untererfassung-Verzerrung ist die Verzerrung, die auftritt, wenn einige Mitglieder einer Population in der Stichprobe unzureichend vertreten sind.
Diese Art von Verzerrung tritt häufig bei willkürlichen Stichproben auf, bei denen man …
Verzerrung durch ausgelassene Variablen tritt auf, wenn eine relevante Erklärungsvariable nicht in ein Regressionsmodell aufgenommen wird, was dazu führen kann, dass der Koeffizient einer oder mehrerer Erklärungsvariablen in dem Modell …