Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
In einem Hypothesentest gibt es immer eine Fehlerrate vom Typ I, die die Wahrscheinlichkeit angibt, eine tatsächlich zutreffende Nullhypothese abzulehnen. Mit anderen Worten, es ist die Wahrscheinlichkeit, ein "falsches Positiv" zu erhalten, d.h. Wenn wir behaupten, dass es einen statistisch signifikanten Effekt gibt, aber es tatsächlich keinen gibt.
Wenn wir einen Hypothesentest durchführen, entspricht die Fehlerrate vom Typ I dem Signifikanzniveau (α), das üblicherweise mit 0.01, 0.05 oder 0.10 gewählt wird. Wenn wir jedoch mehrere Hypothesentests gleichzeitig durchführen, steigt die Wahrscheinlichkeit, ein falsch positives Ergebnis zu erhalten.
Stellen Sie sich zum Beispiel vor, wir würfeln mit 20 Seiten. Die Wahrscheinlichkeit, dass die Würfel auf einer „1“ landen, beträgt nur 5%. Wenn wir jedoch zwei dieser Würfel gleichzeitig werfen, steigt die Wahrscheinlichkeit, dass einer der Würfel auf einer „1“ landet, auf 9.75%. Wenn wir fünf Würfel gleichzeitig würfeln, steigt die Wahrscheinlichkeit auf 22.6%.
Je mehr Würfel wir werfen, desto höher ist die Wahrscheinlichkeit, dass einer der Würfel auf einer 1 landet. Wenn wir mehrere Hypothesentests gleichzeitig mit einem Signifikanzniveau von 0,05 durchführen, steigt die Wahrscheinlichkeit, dass wir ein falsches Positiv erhalten, auf darüber hinaus 0.05.
Die Formel zur Schätzung der Family Wise Error Rate lautet wie folgt:
Family Wise Error Rate = 1 - (1-α)n
wobei:
Angenommen, wir führen 5 verschiedene Vergleiche mit einem Alpha-Level von α = 0.05 durch. Die Family Wise Error Rate Fehlerrate würde wie folgt berechnet:
Family Wise Error Rate = 1 - (1-α)c = 1 - (1-.05)5 = 0.2262.
Mit anderen Worten, die Wahrscheinlichkeit, bei mindestens einem der Hypothesentests einen Fehler vom Typ I zu bekommen, liegt über 22%!
Es gibt verschiedene Methoden, mit denen die Family Wise Error Rate gesteuert werden kann, darunter:
Passen Sie den zur Beurteilung der Signifikanz verwendeten α-Wert so an, dass:
αnew = αold / n
Wenn wir zum Beispiel 5 verschiedene Vergleiche mit einem Alpha-Level von α = 0,05 durchführen, dann wäre unser neues Alpha-Level mit der Bonferroni-Korrektur:
αnew = αold / n = 0.05 / 5 = 0.01.
Passen Sie den zur Beurteilung der Signifikanz verwendeten α-Wert so an, dass:
αnew = 1 - (1-αold)1 / n
Wenn wir beispielsweise 5 verschiedene Vergleiche mit einem Alpha-Level von α = 0,05 durchführen, wäre unser neues Alpha-Level mit der Sidak-Korrektur:
αnew = 1 - (1-αold)1 / n = 1 - (1-.05)1/5 = .010206.
Dieses Verfahren funktioniert wie folgt:
Durch die Verwendung einer dieser Korrekturen für das Signifikanzniveau können wir die Wahrscheinlichkeit, einen Fehler vom Typ I in einer Familie von Hypothesentests zu begehen, drastisch reduzieren.
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …