Kruskal-Wallis-Test in Stata

Zur Untersuchung von Gruppenunterschieden (mehr als 2 Gruppen) biete sich der nicht-parametrische Kursaal-Wallis-Test an. Dieser benötigt ein mindestens ordinalskalierte Merkmal und unterliegt nicht der Normalverteilungsannahme. Im Weiteren wird in diesem Artikel die Umsetzung des Tests in Stata beschrieben.

Die Daten

Für die Analyse laden wir den systeminternen Datensatz auto.dta.

Dieser Datensatz umfasst 12 Merkmale zu N = 71 Automodellen. Unter Anderen beinhaltet der Datensatz die Merkmale Kopffreiheit (headroom) und Preis (Price). Im Folgenden sollen im Folgenden Mittelwertunterschiede zwischen verschiedenen Klassen an Kopffreiheit untersucht werden. Hierbei liegt die Kopffreiheit als metrisches Merkmal vor, sodass eine Klassenbildung erfolgen muss, damit der Kruskal-Wallis-Test verwendet findet.

Mittels der kommenden Befehle wird aus der Variablen Kopffreiheit eine neue Variable klassierte Kopffreiheit generiert. Hierbei wird eine kategoriale Variable mit den Ausprägungen unter 2, zwischen 2 und maximal 3, zwischen 3 und maximal 4 und über 4 erzeugt.

Mittels kommender Befehle erfolgt die Vergabe der Variablen- und Wertelabels.

Analyse

Vor einer induktiven Mittelwertuntersuchung, erfolgt eine Exploration der Daten. Kommender Befehl dient der Visualisierung der Verteilung des Preises nach Kopffreiheitsklassen. Hiermit sind die Verteilungen in Form von Boxplots dargestellt.

Kommende Abbildung zeigt die Verteilungen der Preise nach Kopffreiheit. Hierbei zeigt sich, dass die Verteilungen für 2 thru 3 in. und 3 thru 4 in. rechtsschief sind. Demgegenüber sind die Verteilungen von under 2 in. und over 4 in. jeweils linksschief. Wegen der Schiefe innerhalb der Gruppen kann eine Normalverteilung ausgeschlossen werden. Somit erscheint die Untersuchung der Mittelwertunterschiede mittels eines nicht-parametrischer Tests sinnvoll.

Hierzu wird der Kurskal-Wallis-Test benutzt. Im vorliegenden Falle deutet dieser auf nicht-signifikante Unterschiede im Preis zwischen den Kopffreiheitsklassen hin, \chi^2(3)=2,98, p = 0,394. Damit unterscheidet sich der Preis zwischen den Kopffreiheitsklassen nicht. Auf Grund des nicht-signifikanten Ergebnisses ist eine Post-Hoc-Analyse nicht nötig.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.