So führen Sie eine einfaktorielle ANOVA in Stata durch

Von Fabian
Kategorie: STATA
Tags: ANOVA
Lesezeit: 5 Minuten

Eine einfaktorielle ANOVA wird verwendet, um zu bestimmen, ob es einen statistisch signifikanten Unterschied zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen gibt oder nicht.

Diese Art von Test wird als einfaktorielle ANOVA bezeichnet, da wir analysieren, wie sich eine Prädiktorvariable auf eine Antwortvariable auswirkt. Wenn wir stattdessen daran interessiert wären, wie sich zwei Prädiktorvariablen auf eine Antwortvariable auswirken, könnten wir eine zweifaktorielle ANOVA durchführen.

In diesem Tutorial wird erklärt, wie eine einfaktorielle ANOVA in Stata durchgeführt wird.

Beispiel: einfaktorielle ANOVA in Stata

In diesem Beispiel verwenden wir den integrierten Stata-Datensatz systolisch, um eine einfaktorielle ANOVA durchzuführen. Dieser Datensatz enthält die folgenden drei Variablen für 58 verschiedene Personen:

  • Droge verwendet
  • Krankheit des Patienten
  • Änderung des systolischen Blutdrucks

Wir werden die folgenden Schritte ausführen, um eine einfaktorielle ANOVA durchzuführen, um herauszufinden, ob die Art des verwendeten Arzneimittels zu einem signifikanten Einfluss auf die Änderung des systolischen Blutdrucks führt.

Schritt 1: Laden Sie die Daten.

Laden Sie zuerst die Daten, indem Sie webuse systolic in das Befehlsfeld eingeben und auf die Eingabetaste klicken.

Beispiel zum Laden von Daten in Stata

Schritt 2: Zeigen Sie die Rohdaten an.

Bevor wir eine einfaktorielle ANOVA durchführen, sehen wir uns zunächst die Rohdaten an. Gehen Sie in der oberen Menüleiste zu Daten> Dateneditor> Dateneditor (Durchsuchen). Dies zeigt uns die tatsächlichen Daten für alle 58 Patienten:

Einfaktorielle ANOVA-Beispiel in Stata

Schritt 3: Visualisieren Sie die Daten.

Als nächstes visualisieren wir die Daten. Wir erstellen Boxplots, um die Verteilung der systolischen Blutdruckwerte für jede Arzneimittelkategorie anzuzeigen.

Gehen Sie in der oberen Menüleiste zu Grafik> Boxplot. Wählen Sie unter Variablen die Option Systolic:

Boxplot in Stata

Wählen Sie dann in der Unterüberschrift Kategorien unter Gruppierungsvariable die Option Droge:

Boxplot-Beispiel in Stata

OK klicken. Ein Diagramm mit vier Boxplots wird automatisch angezeigt:

Mehrere Boxplots in Stata

Wir können sofort erkennen, dass die Verteilung der Veränderungen des systolischen Blutdrucks zwischen den Arzneimittelkategorien variiert, aber eine einfaktorielle ANOVA zeigt uns, ob diese Unterschiede statistisch signifikant sind.

Schritt 4: Führen Sie eine einfaktorielel ANOVA durch.

Gehen Sie in der oberen Menüleiste zu Statistik> Lineare Modelle und verwandte> ANOVA / MANOVA> einfaktorielle ANOVA.

Wählen Sie unter Antwortvariable die Option systolisch. Wählen Sie unter Faktorvariable das Medikament aus. Klicken Sie dann auf das Feld neben Übersichtstabelle erstellen, damit einige grundlegende beschreibende Statistiken für jede Gruppe angezeigt werden. Klicken Sie dann auf OK.

Einfaktorielle ANOVA-Beispiel in Stata

Die folgende Ausgabe wird angezeigt:

Einfaktorielle ANOVA in Stata

Die F-Statistik ist 9.09 und der entsprechende p-Wert ist 0.0001. Da der p-Wert kleiner als Alpha = 0,05 ist, können wir die Nullhypothese ablehnen, dass die mittlere Änderung des systolischen Blutdrucks für jede Gruppe gleich ist.

Mit anderen Worten, es gibt einen statistisch signifikanten Unterschied in der mittleren Änderung des systolischen Blutdrucks zwischen mindestens zwei der Arzneimittelgruppen.

Schritt 5: Führen Sie mehrere Vergleichstests durch.

Als nächstes können wir mehrere Vergleichstests durchführen, um tatsächlich herauszufinden, welche Gruppenmittelwerte sich voneinander unterscheiden.

Gehen Sie in der oberen Menüleiste zu Statistik> Zusammenfassungen, Tabellen und Tests> Zusammenfassung und beschreibende Statistik> Paarweise Mittelvergleiche.

Wählen Sie unter Variable die Antwortvariable systolic aus. Wählen Sie für Over die erklärende Variable Droge. Wählen Sie für die Anpassung mehrerer Vergleiche die Tukey-Methode.

Mehrere Vergleiche für einfaktorielle ANOVA in Stata

Klicken Sie dann unter der Unterüberschrift Berichterstellung auf die Schaltfläche neben Effekttabellen und aktivieren Sie das Kontrollkästchen neben Effekttabelle mit Konfidenzintervallen und p-Werten anzeigen. Klicken Sie dann auf OK.

Mehrere Vergleiche in Stata

Die folgenden Ergebnisse werden angezeigt:

Tukeys Test in Stata-Ergebnissen

Jede Zeile repräsentiert einen Vergleich zwischen zwei spezifischen Arzneimittelgruppen. Zum Beispiel vergleicht die erste Zeile die mittlere systolische Blutdruckänderung zwischen Arzneimittelgruppe 2 und Arzneimittelgruppe 1. Der p-Wert für diesen Vergleich beträgt 0,999, was extrem hoch und nicht kleiner als 0,05 ist. Dies bedeutet, dass es keinen statistisch signifikanten Unterschied zwischen den Wirkstoffgruppen 1 und 2 gibt.

Wir können jedoch sehen, dass die p-Werte für die folgenden Vergleiche alle kleiner als 0,05 sind:

  • Droge 3 vs. 1 | p-Wert = 0,001
  • Droge 4 vs. 1 | p-Wert = 0,010
  • Droge 3 vs. 2 | p-Wert = 0,001
  • Droge 4 vs. 2 | p-Wert = 0,015

Dies bedeutet, dass der Unterschied in der mittleren systolischen Blutdruckänderung zwischen jeder dieser Gruppen statistisch signifikant ist.

Schritt 6: Ergebnisse.

Zuletzt werden wir die Ergebnisse unserer einfaktorielle ANOVA-Analyse berichten. Hier ist ein Beispiel dafür:

Eine einfaktorielle ANOVA wurde durchgeführt, um festzustellen, ob vier verschiedene Arten von Arzneimitteln unterschiedliche Auswirkungen auf den systolischen Blutdruck hatten.

Die folgende Tabelle fasst die Anzahl der Teilnehmer in jeder Gruppe zusammen mit der mittleren Änderung des systolischen Blutdrucks und der Standardabweichung des systolischen Blutdrucks für jede Gruppe zusammen:

Beschreibende Statistik für einfaktorielle ANOVA in Stata

Eine einfaktorielle ANOVA ergab einen statistisch signifikanten Unterschied zwischen mindestens zwei Gruppen (F (3, 54) = 9,09, p = 0,001).

Tukeys Test für mehrere Vergleiche ergab, dass die Änderung des systolischen Blutdrucks für Arzneimittel 3 statistisch signifikant höher war als für Arzneimittel 1 (17,32 +/- 4,15, p = 0,001), für Arzneimittel 3 im Vergleich zu Arzneimittel 2 (16,78 +/- 4,15, p = 0,001) für Arzneimittel 4 im Vergleich zu Arzneimittel 1 (12,57 ± 3,85, p = 0,010) und für Arzneimittel 4 im Vergleich zu Arzneimittel 2 (12,03 ± 3,85, p = 0,015).

Es gab keinen statistisch signifikanten Unterschied zwischen den Arzneimittelgruppen 1 und 2 (0,533 ± 3,91, p = 0,999) oder zwischen den Arzneimittelgruppen 3 und 4 (4,75 ± 4,09, p = 0,654).

Statistik: Der Weg zur Datenanalyse

* Amazon Affiliate Link


Das könnte Sie auch interessieren: