Die lineare Regression ist eine der am häufigsten verwendeten Techniken in der Statistik. Es wird verwendet, um die Beziehung zwischen einer oder mehreren Prädiktorvariablen und einer Antwortvariablen zu quantifizieren.

Die grundlegendste Form der linearen Regression ist die einfache lineare Regression, mit der die Beziehung zwischen einer Prädiktorvariablen und einer Antwortvariablen quantifiziert wird.

Wenn wir mehr als eine Prädiktorvariable haben, können wir mehrere lineare Regressionen verwenden, mit denen die Beziehung zwischen mehreren Prädiktorvariablen und einer Antwortvariablen quantifiziert wird.

In diesem Tutorial werden vier verschiedene Beispiele für die Verwendung der linearen Regression im wirklichen Leben vorgestellt.

Beispiel #1 für die lineare Regression im wirklichen Leben

Unternehmen verwenden häufig eine lineare Regression, um die Beziehung zwischen Werbeausgaben und Einnahmen zu verstehen.

Beispielsweise könnten sie in ein einfaches lineares Regressionsmodell passen, bei dem Werbeausgaben als Prädiktorvariable und Einnahmen als Antwortvariable verwendet werden. Das Regressionsmodell würde die folgende Form annehmen:

Einnahmen = β0 + β1(ad Werbeausgaben)

Der Koeffizient β0 würde den erwarteten Gesamtumsatz darstellen, wenn die Werbeausgaben Null sind.

Der Koeffizient β1 würde die durchschnittliche Änderung des Gesamtumsatzes darstellen, wenn die Werbeausgaben um eine Einheit (z. B. einen Dollar) erhöht werden.

Wenn β1 negativ ist, bedeutet dies, dass mehr Werbeausgaben mit weniger Einnahmen verbunden sind.

Wenn β1 nahe Null ist, bedeutet dies, dass die Werbeausgaben nur geringe Auswirkungen auf die Einnahmen haben.

Und wenn β1 positiv ist, würde dies bedeuten, dass mehr Werbeausgaben mit mehr Einnahmen verbunden sind.

Abhängig vom Wert von β1 kann ein Unternehmen entscheiden, seine Werbeausgaben entweder zu verringern oder zu erhöhen.

Beispiel #2 für die lineare Regression im wirklichen Leben

Medizinische Forscher verwenden häufig eine lineare Regression, um die Beziehung zwischen Medikamentendosis und Blutdruck von Patienten zu verstehen.

Beispielsweise könnten Forscher Patienten verschiedene Dosierungen eines bestimmten Arzneimittels verabreichen und beobachten, wie ihr Blutdruck reagiert. Sie könnten in ein einfaches lineares Regressionsmodell passen, bei dem die Dosierung als Prädiktorvariable und der Blutdruck als Antwortvariable verwendet werden. Das Regressionsmodell würde die folgende Form annehmen:

Blutdruck = β0 + β1(Dosierung)

Der Koeffizient β0 würde den erwarteten Blutdruck darstellen, wenn die Dosierung Null ist.

Der Koeffizient β1 würde die durchschnittliche Änderung des Blutdrucks darstellen, wenn die Dosierung um eine Einheit erhöht wird.

Wenn β1 negativ ist, würde dies bedeuten, dass eine Erhöhung der Dosierung mit einer Abnahme des Blutdrucks verbunden ist.

Wenn β1 nahe Null ist, würde dies bedeuten, dass eine Erhöhung der Dosierung mit keiner Änderung des Blutdrucks verbunden ist.

Wenn β1 positiv ist, würde dies bedeuten, dass eine Erhöhung der Dosierung mit einem Anstieg des Blutdrucks verbunden ist.

Abhängig vom Wert von β1 können Forscher entscheiden, die einem Patienten verabreichte Dosierung zu ändern.

Beispiel #3 für die lineare Regression im wirklichen Leben

Agrarwissenschaftler verwenden häufig eine lineare Regression, um die Wirkung von Dünger und Wasser auf die Ernteerträge zu messen.

Beispielsweise könnten Wissenschaftler auf verschiedenen Feldern unterschiedliche Mengen an Dünger und Wasser verwenden und sehen, wie sich dies auf den Ernteertrag auswirkt. Sie passen möglicherweise zu einem multiplen linearen Regressionsmodell, bei dem Dünger und Wasser als Prädiktorvariablen und der Ernteertrag als Antwortvariable verwendet werden. Das Regressionsmodell würde die folgende Form annehmen:

Ernteertrag = β0 + β1(Düngermenge) + β2(Wassermenge)

Der Koeffizient β0 würde den erwarteten Ernteertrag ohne Dünger oder Wasser darstellen.

Der Koeffizient β1 würde die durchschnittliche Änderung des Ernteertrags darstellen, wenn der Dünger um eine Einheit erhöht wird, vorausgesetzt, die Wassermenge bleibt unverändert.

Der Koeffizient β2 würde die durchschnittliche Änderung des Ernteertrags darstellen, wenn das Wasser um eine Einheit erhöht wird, vorausgesetzt, die Düngermenge bleibt unverändert.

Abhängig von den Werten von β1 und β2 können die Wissenschaftler die Menge an Dünger und Wasser ändern, die zur Maximierung des Ernteertrags verwendet wird.

Beispiel #4 für die lineare Regression im wirklichen Leben

Datenwissenschaftler für professionelle Sportteams verwenden häufig eine lineare Regression, um die Auswirkungen verschiedener Trainingspläne auf die Spielerleistung zu messen.

Zum Beispiel könnten Datenwissenschaftler in der NBA analysieren, wie sich unterschiedliche Mengen an wöchentlichen Yoga-Sitzungen und Gewichtheben-Sitzungen auf die Anzahl der Punkte auswirken, die ein Spieler erzielt. Sie passen möglicherweise zu einem multiplen linearen Regressionsmodell, bei dem Yoga-Sitzungen und Gewichtheben als Prädiktorvariablen und Gesamtpunkte als Antwortvariable verwendet werden. Das Regressionsmodell würde die folgende Form annehmen:

Punkte = β0 + β1(Yoga-Sitzungen) + β2(Gewichtheben)

Der Koeffizient β0 würde die erwarteten Punkte darstellen, die für einen Spieler erzielt wurden, der an null Yoga-Sitzungen und null Gewichtheben-Sitzungen teilnimmt.

Der Koeffizient β1 würde die durchschnittliche Änderung der Punkte darstellen, die erzielt werden, wenn wöchentliche Yoga-Sitzungen um eins erhöht werden, vorausgesetzt, die Anzahl der wöchentlichen Gewichtheben-Sitzungen bleibt unverändert.

Der Koeffizient β2 würde die durchschnittliche Änderung der Punkte darstellen, die erzielt werden, wenn die wöchentlichen Gewichtheben-Sitzungen um eins erhöht werden, vorausgesetzt, die Anzahl der wöchentlichen Yoga-Sitzungen bleibt unverändert.

Abhängig von den Werten von β1 und β2 können die Datenwissenschaftler einem Spieler empfehlen, an mehr oder weniger wöchentlichen Yoga- und Gewichtheben-Sitzungen teilzunehmen, um die erzielten Punkte zu maximieren.

Fazit

Die lineare Regression wird in einer Vielzahl realer Situationen in vielen verschiedenen Branchen eingesetzt. Glücklicherweise macht es statistische Software einfach, eine lineare Regression durchzuführen.

In den folgenden Tutorials erfahren Sie, wie Sie mit verschiedenen Softwareprogrammen eine lineare Regression durchführen:

Lineare Regression in Excel – so geht’s
So führen Sie eine multiple lineare Regression in Stata durch
So führen Sie eine lineare Regression auf einem TI-84-Rechner durch
So erstellen Sie ein Streudiagramm mit einer Regressionslinie in R

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: