Ein Konfidenzintervall für die Differenz zwischen den Mittelwerten ist ein Wertebereich, der mit einer bestimmten Wahrscheinlichkeit die wahre Differenz zwischen zwei Populationsmittelwerten enthält.

Dieses Tutorial erklärt Folgendes:

  • Die Motivation für die Erstellung dieses Konfidenzintervalls.
  • Die Formel zur Erstellung dieses Konfidenzintervalls.
  • Ein Beispiel für die Berechnung dieses Konfidenzintervalls.
  • Wie dieses Konfidenzintervall zu interpretieren ist.

Konfidenzintervall für die Differenz zwischen den Mittelwerten: Motivation

Häufig sind Forscher daran interessiert, die Differenz zwischen zwei Populationsmittelwerten zu schätzen. Um diese Differenz zu schätzen, ziehen sie eine Zufallsstichprobe aus jeder Population und berechnen den Mittelwert für jede Stichprobe. Dann können sie die Differenz zwischen den beiden Mittelwerten vergleichen.

Sie können jedoch nicht mit Sicherheit wissen, ob die Differenz der Stichprobenmittelwerte mit der tatsächlichen Differenz der Populationsmittelwerte übereinstimmt. Deshalb können sie ein Konfidenzintervall für die Differenz zwischen den beiden Mittelwerten erstellen. Dies liefert einen Wertebereich, der wahrscheinlich die wahre Differenz zwischen den Populationsmittelwerten enthält.

Angenommen, wir wollen den Unterschied im mittleren Gewicht zwischen zwei verschiedenen Schildkrötenarten schätzen. Da es in jeder Population Tausende von Schildkröten gibt, wäre es zu zeit- und kostenaufwendig, jede einzelne Schildkröte zu wiegen.

Anstatt dessen könnten wir eine einfache Zufallsstichprobe von 15 Schildkröten aus jeder Population nehmen und das mittlere Gewicht in jeder Stichprobe verwenden, um den wahren Unterschied im mittleren Gewicht zwischen den beiden Populationen zu schätzen:

Konfidenzintervall für eine Differenz zwischen zwei Populationsmittelwerten

Das Problem besteht darin, dass unsere Stichproben zufällig sind, so dass die Differenz der mittleren Gewichte zwischen den beiden Stichproben nicht garantiert genau mit der Differenz der mittleren Gewichte zwischen den beiden Populationen übereinstimmt. Um diese Ungewissheit zu erfassen, können wir ein Konfidenzintervall erstellen, das einen Bereich von Werten enthält, die wahrscheinlich den wahren Unterschied im mittleren Gewicht zwischen den beiden Populationen enthalten.

Konfidenzintervall für die Differenz der Mittelwerte: Formel

Wir verwenden die folgende Formel, um ein Konfidenzintervall für eine Differenz zwischen zwei Mittelwerten zu berechnen:

Konfidenzintervall = (x1-x2) +/- t*√((sp2/n1) + (sp2/n2))

wobei:

  • x1, x2: Stichprobe 1 Mittelwert, Stichprobe 2 Mittelwert
  • t: der t-kritische Wert auf der Grundlage des Konfidenzniveaus und (n1+n2-2) Freiheitsgraden
  • sp2: gepoolte Varianz
  • n1, n2: Stichprobenumfang 1, Stichprobenumfang 2

wo:

Konfidenzintervall für die Differenz der Mittelwerte: Beispiel

Angenommen, wir wollen den Unterschied im Durchschnittsgewicht zwischen zwei verschiedenen Schildkrötenarten schätzen. Wir ziehen also eine Zufallsstichprobe von 15 Schildkröten aus jeder Population. Hier sind die zusammengefassten Daten für jede Stichprobe:

Probe 1:

  • x1 = 310
  • s1 = 18,5
  • n1 = 15

Beispiel 2:

  • x2 = 300
  • s2 = 16,4
  • n2 = 15

So finden Sie verschiedene Konfidenzintervalle für die wahre Differenz der mittleren Gewichte der Bevölkerung:

90% Konfidenzintervall:

(310-300) +/- 1,70*√((305,61/15) + (305,61/15)) = [-0,8589, 20,8589]

95% Konfidenzintervall:

(310-300) +/- 2,05*√((305,61/15) + (305,61/15)) = [-3,0757, 23,0757]

99% Konfidenzintervall:

(310-300) +/- 2,76*√((305,61/15) + (305,61/15)) = [-7,6389, 27,6389]

Hinweis: Sie können diese Konfidenzintervalle auch mit dem Statologie-Konfidenzintervall für die Mittelwertdifferenz-Rechner ermitteln.

Sie werden feststellen, dass das Konfidenzintervall umso breiter ist, je höher das Konfidenzniveau ist. Dies ist sinnvoll, da breitere Intervalle mit größerer Wahrscheinlichkeit den wahren Mittelwert der Grundgesamtheit enthalten und wir daher "zuversichtlicher" sind, dass das Intervall den wahren Mittelwert der Grundgesamtheit enthält.

Konfidenzintervall für die Differenz zwischen Mittelwerten: Interpretation

Wir würden ein Konfidenzintervall wie folgt interpretieren:

Es besteht eine 95%ige Chance, dass das Konfidenzintervall von [-3,0757, 23,0757] den wahren Unterschied im mittleren Gewicht zwischen den beiden Schildkrötenpopulationen enthält.

Da dieses Intervall den Wert "0" enthält, bedeutet dies, dass es möglich ist, dass es keinen Unterschied im mittleren Gewicht zwischen den Schildkröten in diesen beiden Populationen gibt. Mit anderen Worten, wir können nicht mit 95%iger Sicherheit sagen, dass es einen Unterschied im mittleren Gewicht zwischen den Schildkröten in diesen beiden Populationen gibt.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: