Selbstselektion-Verzerrung tritt auf, wenn Personen sich selbst auswählen, um an einer Umfrage teilzunehmen.

Angenommen, eine Gemeindeverwaltung verschickt eine Umfrage an alle Einwohner, um sie zu fragen, ob sie der Meinung sind, dass eine neue Kreuzung in der Mitte der Stadt gebaut werden sollte.

Anwohner, die häufig durch diesen Teil der Stadt fahren, und Anwohner, die täglich mit dem Verkehr konfrontiert sind, haben mit größerer Wahrscheinlichkeit eine starke Meinung zu einer neuen Kreuzung und werden mit weitaus größerer Wahrscheinlichkeit tatsächlich auf die Umfrage antworten.

Anwohner, die von zu Hause aus arbeiten oder einfach kein Interesse an den Geschehnissen in der Stadt haben, werden sich dagegen wahrscheinlich nicht die Zeit nehmen, an der Umfrage teilzunehmen.

Daher ist es unwahrscheinlich, dass der Prozentsatz der Befragten, die sich für die neue Kreuzung aussprechen, mit dem Prozentsatz aller Einwohner der Stadt übereinstimmt, die sich für die neue Kreuzung aussprechen.

Selbstselektion: Wenn Personen sich selbst auswählen, um an einer Umfrage teilzunehmen.

Dies führt zu einer Stichprobe von Personen, die nicht repräsentativ für die Gesamtbevölkerung ist.

Das macht es schwierig, die Ergebnisse der Stichprobe auf die Bevölkerung zu verallgemeinern.

Mit anderen Worten, es gibt eine Voreingenommenheit in unseren Stichprobendaten. Das macht es schwierig, die Ergebnisse aus den Stichprobendaten auf die Gesamtpopulation zu verallgemeinern.

Beispiele für Selbstselektion-Verzerrungen

Die folgenden Beispiele veranschaulichen einige Szenarien, in denen eine Verzerrung durch Selbstselektion auftreten kann.

Beispiel 1: Testvorbereitung

Angenommen, eine Lehrerin möchte wissen, ob ein neuer Testvorbereitungskurs den Schülern hilft, ihre Testergebnisse zu verbessern. Sie hängt einen Anmeldebogen vor ihrem Klassenzimmer auf und lässt die Schüler entscheiden, ob sie an dem Kurs teilnehmen möchten.

Eine Verzerrung durch Selbstselektion ist wahrscheinlich, weil Schüler, die fleißiger sind, sich eher anmelden, was bedeutet, dass die Stichprobe der Schüler, die den Kurs belegen, wahrscheinlich nicht mit der Gesamtpopulation der Schüler übereinstimmt, die den Kurs potenziell belegen könnten.

Beispiel 2: Mehrere Sprachen

Angenommen, eine Gemeindeverwaltung verschickt eine Umfrage, in der sie ihre Einwohner fragt, ob sie auf Straßenschildern neben Englisch auch andere Sprachen angeben sollte, um Menschen, die andere Sprachen sprechen, die Orientierung in der Stadt zu erleichtern.

Eine Verzerrung durch Selbstselektion ist wahrscheinlich, da nur Einwohner, die tatsächlich Englisch lesen können, an der Umfrage teilnehmen. Das bedeutet, dass die Meinungen der Umfrageteilnehmer wahrscheinlich nicht mit den Meinungen aller Einwohner der Stadt übereinstimmen.

Beispiel 3: Biologieforschung

Angenommen, eine Biologin versucht, die durchschnittliche Körpergröße einer bestimmten Hirschart zu schätzen, und legt deshalb ein bestimmtes Hirschfutter auf einer offenen Wiese aus und macht Fotos von den Hirschen, die die Wiese betreten, um das Futter zu fressen.

In diesem Beispiel ist eine Verzerrung durch Selbstselektion wahrscheinlich, da nur die Rehe, die diese Art von Wildfutter mögen oder die sich im Freien wohler fühlen, die Wiese betreten und somit in die Stichprobendaten aufgenommen werden.

Deshalb ist es unwahrscheinlich, dass die Durchschnittsgröße der Rehe in dieser Stichprobe mit der Durchschnittsgröße der Rehe in der Gesamtpopulation übereinstimmt.

Warum Selbstselektion-Verzerrungen ein Problem sind

Selbstselektion ist ein Problem, weil sie dazu führt, dass die Personen in der Stichprobe nicht repräsentativ für die Bevölkerung sind.

Erinnern Sie sich daran, dass der Zweck der Erhebung von Stichprobendaten darin besteht, anhand dieser Daten Rückschlüsse auf eine bestimmte Population von Interesse zu ziehen. Wir können jedoch nur dann gültige Schlussfolgerungen ziehen, wenn wir eine repräsentative Stichprobe verwenden.

Repräsentative Stichprobe: Eine Stichprobe, bei der die Merkmale der Individuen weitgehend mit den Merkmalen der Gesamtbevölkerung übereinstimmen.

In der Regel möchten wir, dass die Stichprobe wie eine "Miniversion" der Grundgesamtheit ist. So können wir sicher sein, dass wir aus der Stichprobe Rückschlüsse auf die Grundgesamtheit ziehen können.

Selbstselektion-Verzerrungen verringern

Die naheliegendste Methode zur Verringerung von Verzerrungen durch Selbstselektion besteht darin, den Personen nicht die Möglichkeit zu geben, sich selbst für die Teilnahme an einer Umfrage auszuwählen.

In der Regel sollte eine Wahrscheinlichkeitsstichprobenmethode verwendet werden, um eine Stichprobe zu erhalten.

Wahrscheinlichkeitsstichprobenverfahren: Ein Stichprobenverfahren, bei dem jedes Mitglied einer Grundgesamtheit eine gleiche Wahrscheinlichkeit hat, für die Stichprobe ausgewählt zu werden.

Beispiele für Wahrscheinlichkeitsstichprobenverfahren sind:

1. Einfache Zufallsstichprobe: Auswahl von Personen nach dem Zufallsprinzip durch Verwendung eines Zufallszahlengenerators oder anderer Mittel der Zufallsauswahl.

2. systematische Zufallsstichprobe: Jedes Mitglied einer Grundgesamtheit wird in eine bestimmte Reihenfolge gebracht. Wähle einen zufälligen Startpunkt und wähle jedes nte Mitglied aus, um in der Stichprobe zu sein.

3. geschichtete Zufallsstichprobe: Teilen Sie eine Population in Gruppen auf. Wählen Sie nach dem Zufallsprinzip einige Mitglieder aus jeder Gruppe für die Stichprobe aus.

4. Cluster-Zufallsstichprobe: Teilen Sie eine Grundgesamtheit in Cluster auf. Wählen Sie nach dem Zufallsprinzip einige Cluster aus und nehmen Sie jedes Individuum in den ausgewählten Clustern in die Stichprobe auf.

Jedes dieser Verfahren führt wahrscheinlich zu Stichproben, die für die interessierende Population repräsentativ sind, was eine Verallgemeinerung der Ergebnisse aus den Stichprobendaten auf die Population ermöglicht.

Zusätzliche Ressourcen

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: