Viele statistische Tests gehen davon aus, dass Datensätze normalverteilt sind.

Diese Annahme wird jedoch in der Praxis häufig verletzt. Eine Möglichkeit, dieses Problem zu beheben, besteht darin, die Werte des Datasets mithilfe einer der folgenden drei Transformationen zu transformieren:

1. Log-Transformation: Wandeln Sie die Werte von y in log(y) um.

2. Quadratwurzel-Transformation: Transformieren Sie die Werte von y in √ y.

3. Kubikwurzel-Transformation: Transformieren Sie die Werte von y in y 1/3.

Durch diese Transformationen werden die Daten normalerweise näher normalverteilt. Die folgenden Beispiele zeigen, wie diese Transformationen in Excel durchgeführt werden.

Log-Transformation in Excel

Um eine Log-Transformation auf einen Datensatz in Excel anzuwenden, können wir die Funktion \=LOG10() verwenden.

Der folgende Screenshot zeigt, wie Sie eine Log-Transformation auf ein Dataset in Excel anwenden:

Transformexcel

Um festzustellen, ob diese Transformation den Datensatz normaler verteilt hat, können wir einen Jarque-Bera-Normalitätstest in Excel durchführen.

Die Teststatistik für diesen Test ist definiert als:

JB = (n / 6) * (S2 + (C2/4))

wo:

  • n: die Anzahl der Beobachtungen in der Stichprobe
  • S: die Probenschiefe
  • C: die Beispielkurtosis

Unter der Nullhypothese der Normalität ist JB ~ X2(2).

Wenn der p-Wert, der der Teststatistik entspricht, kleiner als ein Signifikanzniveau (zB α = .05) ist, können wir die Nullhypothese verwerfen und schlussfolgern, dass die Daten nicht normalverteilt sind.

Der folgende Screenshot zeigt, wie Sie einen Jarque-Bera-Test für die Rohdaten und die transformierten Daten durchführen:

(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)

Transformierte Daten in Excel protokollieren

Beachten Sie, dass der p-Wert für die Rohdaten kleiner als 0,05 ist, was darauf hinweist, dass er nicht normalverteilt ist.

Allerdings ist der p-Wert für die transformierten Daten nicht kleiner als 0,05, so dass wir davon ausgehen können, dass es normal verteilt ist. Dies sagt uns, dass die Log-Transformation funktioniert hat.

Quadratwurzel-Transformation in Excel

Um eine Quadratwurzeltransformation auf einen Datensatz in Excel anzuwenden, können wir die Funktion \=WURZEL() verwenden.

Der folgende Screenshot zeigt, wie Sie eine Quadratwurzeltransformation auf einen Datensatz in Excel anwenden:

(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)

Quadratwurzeltransformation in Excel

Beachten Sie, dass der p-Wert des Jarque-Bera-Normalitätstests für die transformierten Daten nicht kleiner als 0,05 ist, was anzeigt, dass die Quadratwurzeltransformation effektiv war.

Cube Root Transformation in Excel

Um eine Kubikwurzeltransformation auf einen Datensatz in Excel anzuwenden, können wir die Funktion \=DATEN^(1/3) verwenden.

Der folgende Screenshot zeigt, wie Sie eine Kubikwurzeltransformation auf ein Dataset in Excel anwenden:

(Die Formeln wurden mit einer englischsprachen Excel-Version erstellt. Für die deutschen Formeln siehe z.B. hier)

Kubikwurzeltransformation in Excel

Der p-Wert des Jarque-Bera-Normalitätstests für die transformierten Daten beträgt nicht weniger als 0,05, was anzeigt, dass die Kubikwurzeltransformation effektiv war.

Alle drei Datentransformationen machten die Rohdaten effektiv normaler verteilt.

Von den drei Transformationen führte die Log-Transformation zum größten p-Wert im Jarque-Bera-Normalitätstest, was uns sagt, dass die Daten wahrscheinlich die „am meisten“ normalverteilten der drei Transformationsmethoden waren.

Zusätzliche Ressourcen

So führen Sie eine Box-Cox-Transformation in Excel durch

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: