Was ist Pseudoreplikation?

Pseudoreplikation ist ein häufiges Problem, das in der Statistik auftritt. In diesem Artikel bieten wir eine einfache Erklärung der Pseudoreplikation sowie einige Beispiele und was zu tun ist, wenn sie auftritt.

Angenommen, wir möchten wissen, ob Medikament A oder Medikament B den Blutdruck besser senken können.

Wenn wir einfach einer Person Medikamente A und einer anderen Person Medikamente B geben und den entsprechenden Blutdruckabfall messen, verfügen wir nicht über genügend Informationen aus der Studie, um die Ergebnisse auf andere Personen als diese beiden zu übertragen. Darüber hinaus reagiert jede einzelne Person unterschiedlich auf Medikamente, sodass die Unterschiede, die wir im Blutdruck sehen, möglicherweise zufällig sind.

Wenn wir jedoch 30 Personen Medikamente A und weiteren 30 Personen Medikamente B geben, können wir weitaus mehr Informationen über die Variabilität der einzelnen Medikamente erhalten. Auf diese Weise können wir mithilfe statistischer Inferenzen herausfinden, ob eines der Medikamente den Blutdruck im Durchschnitt wirksamer senkt als das andere.

Dieses einfache Beispiel zeigt eine wichtige Komponente der statistischen Inferenz: Wenn wir auf Unterschiede zwischen den Behandlungen testen möchten, müssen wir replizieren. Ein häufiger Fehler, der in Studien häufig gemacht wird, ist die Verwendung von Pseudoreplikation.

Replikation bezieht sich auf mehr als eine Versuchseinheit mit derselben Behandlung. Jede Einheit mit der gleichen Behandlung wird als Replikat bezeichnet. Wenn wir beispielsweise jedes Medikament nur einer Person geben, haben wir keine Replikation. Wenn wir jedoch jedes Medikament 30 verschiedenen Personen geben, haben wir 30 Wiederholungen.

Pseudoreplikation bezieht sich auf den Fall, wenn Behandlungen nicht repliziert werden oder wenn die Replikate statistisch nicht unabhängig sind.

Lassen Sie uns drei Beispiele für Pseudoreplikation durchgehen, um sie besser zu verstehen.

Beispiele für Pseudoreplikation

Die folgenden Beispiele veranschaulichen verschiedene Möglichkeiten, wie Pseudoreplikation in statistischen Studien auftreten kann.

Beispiel 1#

Szenario: Angenommen, Forscher möchten wissen, ob Programm A oder Programm B High-School-Basketballspielern dabei hilft, höher zu springen. Ein Highschool-Team an einer örtlichen Schule wird zufällig ausgewählt, um Programm A für einen Monat umzusetzen, während ein anderes Highschool-Team an einer anderen örtlichen Schule zufällig ausgewählt wird, um Programm B für einen Monat umzusetzen. Nach einem Monat werden die Spieler in jedem Team getestet, um ihren maximalen Sprung zu messen.

Problem: In dieser Studie gibt es keine echte Replikation. In diesem Beispiel sind die Schulen die experimentellen Einheiten, denen zufällig eine Behandlung zugewiesen wird. Obwohl mehrere Spieler aus jeder Schule an dem Programm teilnehmen, sind die Spieler Pseudo-Replikate, da die Ergebnisse für jeden Spieler nicht unabhängig sind. Sie werden von den Trainern, den Übungsstilen und anderen teamspezifischen Faktoren beeinflusst.

Abhilfe: Wir benötigen mehrere Replikate der experimentellen Einheiten. In diesem Fall müssen wir, da die experimentellen Einheiten die Teams sind, jedem Programm mehr als ein Highschool-Team zuweisen. Weisen Sie beispielsweise fünf lokale Highschool-Teams für die Verwendung von Programm A und fünf verschiedene Teams für die Verwendung von Programm B zu. Dies würde uns Informationen über die Variabilität der Auswirkungen der verschiedenen Programme geben.

Beispiel #2

Szenario: Angenommen, Forscher möchten wissen, ob Medikament A oder Medikament B den Blutdruck wirksamer senken. Medikamente A werden an eine Person und Medikamente B an eine andere Person verabreicht. Der Blutdruck jeder Person wird zehn Wochen lang einmal pro Woche gemessen.

Problem: In dieser Studie gibt es keine echte Replikation. In diesem Beispiel werden mehrere Messungen an derselben Person durchgeführt. Dies ist ein Beispiel für eine wiederholte Messung und keine Replikation.

Abhilfe: Wir benötigen mehrere Replikate der experimentellen Einheiten. In diesem Fall müssen wir, da die experimentellen Einheiten die Individuen sind, mehr als eine Person zuweisen, um jedes Medikament zu verwenden. Weisen Sie beispielsweise 30 Personen für die Verwendung von Medikament A und 30 Personen für die Verwendung von Medikament B zu. Dies würde uns Informationen über die Variabilität der Wirkung der verschiedenen Medikamente geben.

Beispiel #3

Szenario: Angenommen, Forscher möchten wissen, ob Formel A oder Formel B das Wachstum von Pflanzen effektiver macht. Die Formel A wird auf 100 Pflanzen in einem Feld gestreut, und die Formel B wird auf 100 Pflanzen in einem anderen Feld mehrere Meilen die Straße hinunter gestreut.

Problem: In dieser Studie gibt es keine echte Replikation. In diesem Beispiel sind die Felder die experimentellen Einheiten, denen zufällig eine Behandlung zugewiesen wird. Obwohl mehrere Pflanzen aus jedem Feld mit der Formel bestreut sind, sind die Pflanzen Pseudo-Replikate, da die Ergebnisse für jede Pflanze nicht unabhängig sind; Die 100 Pflanzen in jedem Feld teilen sich die Bedingungen auf diesem Feld (Bodenbedingungen, natürliche Raubtiere, Wetterbedingungen, Niederschlagsmenge auf einem Feld im Vergleich zum anderen usw.).

Abhilfe: Wir benötigen mehrere Replikate der experimentellen Einheiten. In diesem Fall müssen wir, da die experimentellen Einheiten die Pflanzen sind, Formel A auf 100 Pflanzen und Formel B auf 100 Pflanzen streuen, die sich alle auf dem Feld befinden. Dies stellt sicher, dass die Bedingungen des Feldes die Ergebnisse einer Behandlung nicht mehr als die der anderen verzerren, da sich die Pflanzen, die die Formel A erhalten, und die Pflanzen, die die Formel B erhalten, alle auf demselben Feld befinden.

Auswirkungen der Pseudoreplikation

Wenn in einer Studie eine Pseudoreplikation auftritt, wird die Variabilität wahrscheinlich unterschätzt. Dies hat zwei Auswirkungen:

Konfidenzintervalle sind wahrscheinlich zu eng (und nicht vertrauenswürdig).
Der Fehler vom Typ I (Wahrscheinlichkeit, eine echte Nullhypothese fälschlicherweise abzulehnen) ist größer.

Beides sind unerwünschte Effekte in einer Studie und machen statistische Schlussfolgerungen unzuverlässig. Dies bedeutet, dass es schwierig sein wird, die Ergebnisse der Studie auf eine größere Population zu übertragen.

Was tun?

Vermeiden Sie nach Möglichkeit die Pseudoreplikation, wenn Sie ein Experiment entwerfen. Beachten Sie, dass bei Beobachtungsstudien eine Pseudoreplikation häufig vorkommt und häufig nicht vermieden werden kann.

Wenn es nicht möglich ist, eine Pseudoreplikation zu vermeiden, betrachten Sie die Studie als eine vorläufige Studie, die verwendet werden kann, um in Zukunft eine bessere Studie zu entwerfen. Seien Sie außerdem offen für die Einschränkungen der Studie, wenn Sie Ergebnisse einem größeren Publikum melden.

Was ist Pseudoreplikation?