Kruskal-Wallis-Test in R

Der Kruskal-Wallis-Test kann verwendet werden, falls ein mindestens ordinalskaliertes Merkmal zwischen zwei oder mehr Gruppen verglichen werden soll. Er unterliegt im Vergleich zur Varianzanalyse weniger harten Annahmen. Zum Beispiel ist eine Normalverteilung innerhalb der Gruppen keine Voraussetzung dieses Tests.

Die Daten

Wir nutzen für die heutige Analyse den Datensatz chickwts aus dem Paket datasets. Er besteht aus N = 71 Beobachtungen und 2 Merkmalen. Zum einen das Gewicht von 71 Hühnern. Zum Anderen eine kategoriales Merkmal, welches den Futtertyp angibt. Dabei liegen bei dem Futtertyp 6 Ausprägungen, also verschiedenen Futterarten, vor.

Wir wollen im Folgenden untersuchen, ob zwischen den 6 Futtertypen signifikante Gewichtsunterschiede vorliegen.

Die Analyse

Zunächst betrachten wir die Verteilungen der Gewichte für die 6 Futtertypen visuell. Hierzu erstellen wir mit dem kommenden Befehl Boxplots.

Kommende Grafik zeigt die Boxplots. Zunächst fällt auf, dass sich die Verteilungen sehr in ihren Streuungen visuell unterscheiden. Weiterhin ist zu erkennen, dass sich ebenfalls die durchschnittlichen Gewichte der Hühner nach Futtertyp unterscheiden. Ebenfalls wirken die Verteilungen alle, bis auf die zu horsebean, sehr asymmetrisch. Dies deutet auf eine Verletzung der Normalverteilungsannahme hin. Somit werden die Unterschiede zwischen den Futtergruppen mittels eines geeigneten nicht-parametrischer (verteilungsfreien) Test untersucht.

Für die Untersuchung auf Gruppenunterschiede mittels eines geeigneten verteilungsfreien Tests untersucht. Hierbei eignet sich der Kruskal-Wallis-Test. Mit dem kommenden Befehl lässt sich dieser in R berechnen. Er liefert ein signifikantes Ergebnis, \chi^2(5)=37,34, p = 0,000. Somit unterscheidet sich das Gewicht des Hühner zwischen den Futtertypen signifikant. Zur Prüfung, wie sich die Futtertypen paarweise unterscheiden wird eine Post-Hoc-Analyse vollzogen. Hierfür verwenden wir den Dunn-Test.

Der Dunn-Test ist in dem Paket FSA implementiert. Mit kommenden Befehl wird dieses Paket in R geladen.

Kommender Output zeigt die Ergebnisse. Hierbei wurde die Funktion dunnTest() benutzt. Es wurde mittels der Benjamin-Hochberg-Korrektur für das multiple Testproblem korrigiert. Dabei zeigt sich, dass zwischen casein & horsebean, casein & linseed, horsebean & meatmeal, casein & soybean, horsebean & soybean, horsebean & sunflower, linseed & sunflower und soybean & sunflower signifikante Mittelwertunterschiede vorliegen.