Ein Konfidenzintervall für einen Korrelationskoeffizienten ist ein Wertebereich, der mit einer gewissen Wahrscheinlichkeit einen Populationskorrelationskoeffizienten enthält.

In diesem Tutorium wird Folgendes erklärt:

  • Die Motivation für die Erstellung dieser Art von Konfidenzintervall.
  • Die Formel zur Erstellung dieser Art von Konfidenzintervall.
  • Ein Beispiel für die Erstellung dieser Art von Konfidenzintervall.
  • Wie man diese Art von Konfidenzintervall interpretiert.

Konfidenzintervall für einen Korrelationskoeffizienten: Motivation

Der Grund für die Erstellung eines Konfidenzintervalls für einen Korrelationskoeffizienten ist die Erfassung unserer Unsicherheit bei der Schätzung eines Korrelationskoeffizienten der Bevölkerung.

Angenommen, wir wollen den Korrelationskoeffizienten zwischen Größe und Gewicht der Einwohner eines bestimmten Bezirks schätzen. Da es in diesem Bezirk Tausende von Einwohnern gibt, wäre es zu kostspielig und zeitaufwändig, alle Einwohner zu besuchen und Informationen über ihre Größe und ihr Gewicht zu sammeln.

Anstatt dessen könnten wir eine einfache Zufallsstichprobe von Einwohnern auswählen und einfach Informationen über sie sammeln.

Beispiel für die Schätzung des Bevölkerungsanteils

Da wir eine Zufallsstichprobe von Einwohnern auswählen, gibt es keine Garantie dafür, dass der Korrelationskoeffizient zwischen Größe und Gewicht für diese Einwohner in der Stichprobe genau dem Korrelationskoeffizienten in der Grundgesamtheit entspricht. Um diese Unsicherheit zu erfassen, können wir ein Konfidenzintervall erstellen, das einen Bereich von Werten enthält, die wahrscheinlich den wahren Korrelationskoeffizienten zwischen Größe und Gewicht der Einwohner in diesem Bezirk enthalten.

Konfidenzintervall für einen Korrelationskoeffizienten: Formel

Wir verwenden die folgenden Schritte, um ein Konfidenzintervall für einen Populationskorrelationskoeffizienten zu berechnen, basierend auf dem Stichprobenumfang n und dem Stichprobenkorrelationskoeffizienten r.

Schritt 1: Durchführen der Fisher-Transformation.

Lass zr = ln(1+r / 1-r) / 2

Schritt 2: Ermitteln der logarithmischen Ober- und Untergrenze.

Lass L = zr - (z1-α/2 /√(n-3))

Let U = zr + (z1-α/2 /√(n-3))

Schritt 3: Konfidenzintervall ermitteln.

Das endgültige Konfidenzintervall kann mit der folgenden Formel ermittelt werden:

Konfidenzintervall = [(e2L-1)/(e2L+1), (e2U-1)/(e2U+1)]

Konfidenzintervall für ein Korrelationskoeffizient: Beispiel

Angenommen, wir wollen den Korrelationskoeffizienten zwischen Größe und Gewicht der Einwohner eines bestimmten Bezirks schätzen. Wir wählen eine Zufallsstichprobe von 30 Einwohnern aus und erhalten die folgenden Informationen:

  • Stichprobengröße n = 30
  • Korrelationskoeffizient zwischen Größe und Gewicht r = 0,56

So findet man ein 95%-Konfidenzintervall für den Korrelationskoeffizienten der Bevölkerung:

Schritt 1: Durchführen der Fisher-Transformation.

Lassen Sie zr = ln(1+r / 1-r) / 2 = ln(1+.56 / 1-.56) / 2 = 0.6328

Schritt 2: Ermitteln der logarithmischen Ober- und Untergrenze.

Lass L = zr - (z1-α/2 /√(n-3)) = .6328 - (1.96 /√(30-3)) = .2556

Lassen Sie U = zr + (z1-α/2 /√(n-3)) = .6328 + (1,96 /√(30-3)) = 1,01

Schritt 3: Konfidenzintervall ermitteln.

Konfidenzintervall = [(e2L-1)/(e2L+1), (e2U-1)/(e2U+1)]

Konfidenzintervall = [(e2(.2556)-1)/(e2(.2556)+1), (e2(1.01)-1)/(e2(1.01)+1)] = [.2502, .7658]

Hinweis: Sie können dieses Konfidenzintervall auch mit Hilfe des Konfidenzintervalls für einen Korrelationskoeffizienten-Rechners.

Konfidenzintervall für einen Korrelationskoeffizienten: Interpretation

Wir würden ein Konfidenzintervall wie folgt interpretieren:

Es besteht eine 95%ige Chance, dass das Konfidenzintervall von [.2502, .7658] den wahren Korrelationskoeffizienten der Bevölkerung zwischen Größe und Gewicht der Einwohner in diesem Bezirk enthält.

Eine andere Art, dasselbe zu sagen, ist, dass es nur eine 5 %ige Chance gibt, dass der wahre Korrelationskoeffizient der Bevölkerung außerhalb des 95 %-Konfidenzintervalls liegt. Das heißt, es besteht nur eine 5 %ige Chance, dass der wahre Korrelationskoeffizient zwischen Größe und Gewicht der Einwohner in diesem Bezirk kleiner als .2502 oder größer als .7658 ist.

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: