Was kann ich tun, bei sinnlosen bzw. gigantischen Odds-Ratio ?

In der medizinischen Statistik werden häufig nominale Merkmale in Vierfeldertafeln, jedoch auch in größeren Kreuztabellen betrachtet.  Im Falle medizinischer Studien, kommen diese statistischen Werkzeuge  bei Therapiebewertungen zum Einsatz. Auf Basis der Kreuztabelle lassen sich Kennzahlen zur Therapiebewertung bestimmen. Beliebte Kennzahlen sind das Odds Ratio oder das relative Risiko. Im Folgenden werden wir uns auf das Odds Ratio beziehen. „Was kann ich tun, bei sinnlosen bzw. gigantischen Odds-Ratio ?“ weiterlesen

Welche Gedanken müssen vor der Daten-Auswertung erfolgen?

Häufig treffen Personen, die in Daten-Auswertung geringe Erfahrungen haben, die Entscheidung, Ihre Daten einfach mal drauf los auszuwerten. In diesem Zusammenhang können wir als professionelle Statistik-Beratung nur davon abraten. Vor der Daten-Auswertung sollten sich einige Gedanken um die Auswertungsziele, dem inhaltlichen Hintergrund zur Auswertung etc. gemacht werden. Faraway (2005) hat hierzu einige Punkte in der Einführung seines Buches angesprochen, die sich Laien, aber auch eine professionelle Statistik-Beratung, zu Herzen nehmen sollten. Wir haben uns entschlossen, jene Empfehlungen wörtlich zu zitieren:

„Welche Gedanken müssen vor der Daten-Auswertung erfolgen?“ weiterlesen

Wie interpretiere ich eine Kreuztabelle?

Häufig begegnet uns während der Statistik-Beratung das Problem, dass unsere Kunden "einfache" deskriptive Verfahren nicht verstehen bzw. interpretieren können. Bewusst wurde das Wort einfach in Anführungszeichen gesetzt, da deskriptive Verfahren vom statistischen Anspruch eher die Basis bilden, und dennoch bei ungeübten Menschen für Interpretationsschwierigkeiten sorgen. Zu diesem Zweck werden wir uns heute mit der Interpretation bzw. Bedeutung von bivariaten Häufigkeitsverteilungen, im SPSS-Jargon auch Kreuztabellen genannt, beschäftigen.

„Wie interpretiere ich eine Kreuztabelle?“ weiterlesen

Drei große Irrtümer bei der Interpretation induktiver Statistik

Die Interpretation statistischer Tests bietet vielen Leuten extreme Schwierigkeiten. So halten sich hartnäckig diverse Gerüchte bezüglich der validen Interpretation von statistischen Experimenten. Heute gehen wir in unserer Beratung auf drei der größten Irrtümer ein und erläutern, wie in der jeweiligen Situation, die Kennzahlen etc. richtig zu interpretieren sind.

„Drei große Irrtümer bei der Interpretation induktiver Statistik“ weiterlesen

Wie funktioniert eine Varianzanalyse?

Bei der Varianzanalyse (ANOVA) wird ein metrisches Merkmal durch ein oder mehrere kategoriale Merkmale erklärt. Zum Beispiel kann damit der Ernteertrag in kg (metrisch) durch die Verwendung verschiedener Düngemittel (kategorial) erklärt werden. Stellen wir uns vor, wir haben 30 Felder, wobei auf jeweils 10 Feldern eines von 3 Düngemitteln verwendet wird. In diesem Falle handelt es sich um ein balanciertes Design, da jedes Düngemittel auf genau 10 Feldern verwendet wird. „Wie funktioniert eine Varianzanalyse?“ weiterlesen

Die verschiedenen Streuungsmaße

Wie wir schon kennengelernt haben, lässt sich eine Häufigkeitsverteilung über ihren Mittelwert beschreiben. Hierbei sind uns verschiedene Durchschnittwerte begegnet. Ebenfalls lässt sich eine Beobachtungsreihe durch ihre Streuung beschreiben. Auch hier existieren verschiedene Streumaße, welche wir uns im Folgenden näher anschauen werden. „Die verschiedenen Streuungsmaße“ weiterlesen

Analyse des Wegwerfverhaltens von Lebensmitteln?

Heute etwas angewandte Statistik. Das heutige Thema dieser Auswertung ist eine Debatte, die im Oktober 2011, kurzzeitig im Bundestag entbrannt ist. Es ist zwar nicht mehr so stark medial präsent. Dennoch sehr interessant. Die Analyse habe ich damals zu Studienzeiten selbst durchgeführt. Sie war Teil einer Seminararbeit. „Analyse des Wegwerfverhaltens von Lebensmitteln?“ weiterlesen

Wie funktioniert ein statistischer Test?

Grundlagen des statistischen Testens

Bei einem statistischen Test treffen wir eine Entscheidung zwischen zwei sich inhaltlich widersprechenden Aussagen. Diese Aussagen nennen wir Hypothesen. Hierbei unterscheiden wir zwischen der Nullhypothese; diese Behauptung soll auf ihren Wahrheitsgehalt überprüft werden, sie bildet somit den Ausgangspunkt einer statistischen Analyse, den es zu widerlegen gilt, und der Alternativhypothese; diese Aussage ist entgegengesetzt zur Nullhypothese formuliert, welche mittels eines (geeigneten) statistischen Tests gezeigt werden soll. Weiterhin benötigen wir eine Teststatistik oder Prüfgröße, die wir auf Basis der vorliegenden Daten berechnen und uns eine formale Entscheidungsregel liefert. „Wie funktioniert ein statistischer Test?“ weiterlesen

Verschiedene Mittelwerte

Wie auf der Webseite der Mehr als Durchschnitt Statistikberatung angedeutet, existieren mehrere Durchschnittswerte, welche je nach Situation verwendet werden sollten. Der Name des Unternehmens, das sich auf Beratung in Statistik spezialisiert hat, ist unter anderem dieser Tatsache geschuldet. Kommen wir nun aber zu  verschiedenen Lagemaßen, deren Verwendung und Berechnung. „Verschiedene Mittelwerte“ weiterlesen

Skalenniveaus von Daten

Die Statistik-Beratung Mehr als Durchschnitt eröffnet seinen Blog mit einem Thema, mit welchem sich beschäftigt werden sollte sobald die Hypothesen stehen und die Daten erhoben worden sind. Es dient die Forschungsfragen auf Basis der Daten zu überprüfen.  Denn die Wahl der geeigneten Methoden zur Prüfung der Hypothesen sind unter anderem von dem Skalenniveau der betrachteten Variablen des Datensatzes abhängig. Die verschiedenen Skalenniveaus werden in unterer Aufzählung dargestellt. Hierbei werden die Skalenniveaus aufsteigend beschrieben. Wir beginnen mit dem niedrigsten Skalenniveau und arbeiten uns schrittweise zu höheren Niveaus heran. Daten sind Informationen. Deswegen bedeutet ein niedriges Skalenniveau wenig und ein hohes Skalenniveau viel Information in unseren Daten. „Skalenniveaus von Daten“ weiterlesen