Wir eklären Ihnen in diesem Beitrag, wie sich eine Varianzanalyse (ANOVA) in Stata umsetzen lässt.

Die Daten

Bei dieser Auswertung verwenden wir den Stata 17 manual dataset sorghum.dta. Sie können ihn mittels des Befehls:

use https://www.stata-press.com/data/r17/sorghum.dta

laden. Der Datensatz umfasst Daten zu Blattflächenindex bei 4 Sorghumsorten. Wir möchten die Blattflächenindizes zum ersten Zeitpunkt in Abhängigkeit der Sorghumsorte erklären. Da die abhängige Varible metrisch ist und die unabhängige katgeorial bietet sich die ANOVA zur Untersuchung auf Unterschiede in den Indizes zwischen den Sorten an. Kommendes Bild zeigt den mit dem Befehl describe beschriebenen Datensatz.

Varianzanalyse (ANOVA) in Stata

Die Analyse

Zunächst betrachten wir die Mittelwerte zwischen den Sorten mittels deskriptiven Statistiken. Hierzu können wir den Befehl summarize mit der bysort Präfix kombinieren um die Mittelwerte, Standardabweichungen etc. für die verschiedenen Sorten zuberechnen. Kommendes Bild zeigt uns die Ergebnisse. Sorte 1 hat hierbei den geringsten Mittelwert, M = 4,2. Hierauf folgt Sorte 3, M = 4,9. Die Sorten 2 bzw. 4 sind mit, M = 5,1 bzw. M = 5,2 etwa gleich auf.

Varianzanalyse (ANOVA) in Stata

Um eine Varianzanalyse in Stata durchzuführen gehen verwenden Sie den Befehl anova time1 variety. Es zeigen sich hierbei keine signifikanten Unterschiede in dem Blattindex zwischen den Gruppen, F(3, 16) = 1,72, p = 0,203.

Varianzanalyse (ANOVA) in Stata

Es zeigten sich keine signifikanten Unterschiede zwischen den Gruppen. Wir haben jedoch noch nicht die Annahmen, Varianzhomogenität und Normalverteilung der Residuen überprüft. Dies erfolgt nun. Mittels des postestimaton commands estat kombiniert mit hettest wird ein Test auf Varianzgleichheit durchgeführt. Kommendes Bild zeigt uns das Ergebnis. Hierbei zeigen sich nicht-signifikante Varianzunterschiede, p = 0,581.

Varianzanalyse (ANOVA) in Stata

Abschließend wird die Normalverteilungsannahme überprüft. Hierzu müssen die Residuen mit predict res, res als Variable abgespeichert werden. Dabei steht das res nach dem predict für den Variablennamen und das res nach dem Komma, stellt die Option Residuen dar. Ähnlich können die fitted values mit entsprechender Option abgespeichert werden. Daraufhin können wir uns mit qnorm ein Q-Q-Plot der Residuen anschauen. Anscheinend ist die Normalverteilungsannahme verletzt. Mögliche Auswege aus dieser Situation: Verwendung eines Bootstraps oder Nutzung nicht-parametrischer Methoden, wie Kruskal-Wallis-Test.

Varianzanalyse (ANOVA) in Stata

Sie benötigen weitere Hilfen?

Sie wollen wissen, wie eine ANOVA in R oder wie eine Varianzanalyse in SPSS umgesetzt wird? Dann schauen Sie sich gerne über den entsprechenden Links um.

Sie interessieren sich für ANOVAs oder andere Stata-Auswertungen, dann schauen Sie sich gerne weiter auf unserer Webseite oder unserem Statistik-Blog um. Ebenfalls bieten wir Statistik-Beratung für Unternehmen, Forschung und Studenten/Doktoranden an. Weiterhin bieten wir Daten-Auswertungen Statistik-Schulungen, Data-Mining und statistische-Programmierung an. Sehen Sie sich gerne um und machen sich mit unseren Dienstleistungen vertraut.

Sie haben noch Fragen zur Statistik-Beratung oder anderen Leistungen?

Sie erreichen die Mehr als Durchschnitt Statistikberatung über das Kontaktformular, telefonisch unter +49 152 2269 1443 oder per Mail . Mehr als Durchschnitt freut sich auf Ihre Anfrage.