Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
- K: Die Anzahl der Modellparameter …
Die lineare Regression ist eine Methode, mit der wir die Beziehung zwischen einer oder mehreren erklärenden Variablen und einer Antwortvariablen verstehen können.
Wenn wir eine lineare Regression durchführen, sind wir normalerweise daran interessiert, den Mittelwert der Antwortvariablen basierend auf dem Wert der erklärenden Variablen zu schätzen. Aber wir könnten stattdessen den Median, das 0,25-Perzentil, das 0,90-Perzentil oder ein beliebiges Perzentil schätzen.
Hier kommt die Quantilregression ins Spiel. Ähnlich wie bei der gewöhnlichen linearen Regression erstellt die Quantilregression eine Regressionsgleichung, die einen Wert (z. B. den Median, 0,25 Perzentil, 0,90 Perzentil usw.) für eine Antwortvariable basierend auf dem Wert der erklärenden Variablen vorhersagt.
In diesem Tutorial wird erklärt, wie die Quantilregression in Stata durchgeführt wird.
In diesem Beispiel verwenden wir das integrierte Stata-Dataset namens car. Zuerst passen wir ein lineares Regressionsmodell an, bei dem weight als Prädiktorvariable und mpg als Antwortvariable verwendet werden. Dies sagt uns die erwarteten durchschnittlichen Miles per Gallon (mpg) eines Autos, basierend auf seinem Gewicht (weight). Dann passen wir ein Quantil-Regressionsmodell an, um das 0,90-Perzentil von mpg eines Autos basierend auf seinem Gewicht (weight) vorherzusagen.
Schritt 1: Laden und Anzeigen der Daten.
Verwenden Sie den folgenden Befehl, um die Daten zu laden:
sysuse car
Verwenden Sie den folgenden Befehl, um eine Zusammenfassung der Variablen mpg und weight zu erhalten:
summarize mpg weight
Schritt 2: Führen Sie eine einfache lineare Regression durch.
Verwenden Sie den folgenden Befehl, um eine einfache lineare Regression durchzuführen, wobei Sie das Gewicht als erklärende Variable und mpg als Antwortvariable verwenden:
regress mpg weight
Aus der Ausgabetabelle können wir erkennen, dass die geschätzte Regressionsgleichung lautet:
vorhergesagter mpg = 39,44028 – 0,0060087 * (weight)
Wir können diese Gleichung verwenden, um den geschätzten durchschnittlichen mpg für ein Auto angesichts seines Gewichts zu ermitteln. Zum Beispiel wird ein Auto, das 4.000 Pfund wiegt, auf mpg von 15.405 geschätzt:
vorhergesagter mpg = 39,44028 – 0,0060087 * (4000) = 15,405
Schritt 3: Führen Sie eine Quantilsregression durch.
Als nächstes wollen wir eine Quantilsregression durchführen, um das geschätze 0,90 Perzentil bzgl. mpg zu erhalten, bezogen auf das Gewicht des Autos.
Verwenden Sie den Befehl qreg zusammen mit dem quantile(0.90), um diese Quantilsregression durchzuführen:
qreg mpg weight, quantile(0,90)
Aus der Ausgabetabelle können wir erkennen, dass die geschätzte Regressionsgleichung lautet:
vorhergesagtes 0,90 Perzentil von mpg = 47,02632-0,0072368 * (weight)
Wir können diese Gleichung verwenden, um das geschätzte mpg für ein Auto im 0,90 Perzentil zu finden, abhängig von seinem Gewicht. Zum Beispiel wird das 0,90 Perzentil von mpg für ein Auto, das 4000 Pfund auf 18,709 geschätzt:
vorhergesagtes 0,90 Perzentil von mpg = 47,02632-,0072368 * (4000) = 18,079
Denken Sie daran, dass unser vorheriges lineares Regressionsmodell uns sagte, dass ein Auto, das 4.000 Pfund wiegt, einen geschätzten durchschnittlichen mpg von 15,405 hat. Daher macht es Sinn, dass diese Quantilsregression-Modell uns sagt, dass ein Auto, das 4000 Pfund wiegt ein mpg von 18,079 haben müßte, um im 0,90 Perzentil aller Autos mit diesem bestimmten Gewicht zu sein.
Es ist auch möglich, in Stata mehrere Quantilsregressionen gleichzeitig durchzuführen. Angenommen, wir daran interessiert, das 0,25-Perzentil, den Median (0,50-Perzentil) und das 0,90-Perzentil auf einmal zu schätzen.
Dazu können wir den Befehl sqreg zusammen mit dem Befehl q() verwenden, um anzugeben, welche Quantile geschätzt werden sollen:
sqreg mpg weight, q(0,25, 0,50, 0,90)
Mit dieser Ausgabe können wir die geschätzten Regressionsgleichungen für jede Quantilsregression erstellen:
(1) vorhergesagtes 0,25-Perzentil von mpg = 35,22414 – ,0051724 * (weight)
(2) vorhergesagtes 0,50-Perzentil von mpg = 36,94667 – 0,0053333 * (weight)
(3) vorhergesagtes 0,90-Perzentil von mpg = 47,02632 – ,0072368 * (weight)
So führen Sie eine einfache lineare Regression in Stata durch
Das Akaike-Informationskriterium (AIC) ist eine Metrik, die verwendet wird, um die Anpassung verschiedener Regressionsmodelle zu vergleichen.
Es wird berechnet als:
AIC = 2K – 2ln (L)
wo:
Die logistische Regression ist eine statistische Methode, die wir verwenden, um ein Regressionsmodell anzupassen, wenn die Antwortvariable binär ist.
Um zu beurteilen, wie gut ein logistisches Regressionsmodell zu einem Datensatz …