Skalenniveaus von Daten

Die Statistik-Beratung Mehr als Durchschnitt eröffnet seinen Blog mit einem Thema, mit welchem sich beschäftigt werden sollte sobald die Hypothesen stehen und die Daten erhoben worden sind. Es dient die Forschungsfragen auf Basis der Daten zu überprüfen.  Denn die Wahl der geeigneten Methoden zur Prüfung der Hypothesen sind unter anderem von dem Skalenniveau der betrachteten Variablen des Datensatzes abhängig. Die verschiedenen Skalenniveaus werden in unterer Aufzählung dargestellt. Hierbei werden die Skalenniveaus aufsteigend beschrieben. Wir beginnen mit dem niedrigsten Skalenniveau und arbeiten uns schrittweise zu höheren Niveaus heran. Daten sind Informationen. Deswegen bedeutet ein niedriges Skalenniveau wenig und ein hohes Skalenniveau viel Information in unseren Daten.

Nominalskala

Die niedrigste Skala ist die sogenannte nominal Skala. Diese Skala umfasst Daten die wir durch ihre Art  beschreiben können. Jedoch nicht anderweitig.  Einem nominalen Skalenniveau folgt beispielsweise das Merkmal Geschlecht (mit den Ausprägungen männlich/weiblich). Ebenso sind die teilnehmenden Parteien für die Wahl in das Europaparlament nominalskaliert. Die beiden Merkmale haben gemeinsam, dass man ihre Ausprägungen in ihrer Art unterscheiden. Wir sprechen in diesem Zusammenhang auch von kategorialen Merkmalen.  Dem Gegenüber können wir aber nicht  zwischen den Kategorien eine Rangstruktur unterstellen. Dies führt uns zur nächsthöheren Skala.

Ordinalskala

Kategoriale Merkmalen mit einer Rangstruktur heißen ordinale Merkmale. Schulnoten mit den Ausprägungen sehr gut bis ungenügend folgen beispielsweise einer Ordinalskala.

Eine wesentliche Eigenschaft der Ordinalskala ist es, dass wir die Abstände zwischen Kategorien nicht interpretieren können.  Zwar ist  sehr gut besser als gut.  Jedoch kann dieser Unterschied  nicht zahlenmäßig erfasst werden. Man kann nun behaupten, dass die Ausprägungen unserer Noten mit 1 bis 6 kodiert werden.  Dann wären die Abstände zwischen den Noten interpretierbar. Wir haben ja nun Zahlen vorliegen. Der Abstand wäre dem zu Folge 2 - 1 = 1.

Jedoch können wir die Kodierung willkürlich wählen.  Beispielsweise hätten wir sehr gut auch mit -1 und gut mit 3 kodieren können. Dann ergäbe sich ein Abstand von  3 - ( -1) = 4. Die Möglichkeit der willkürlichen Kodierung von ordinalen Merkmale führt also dazu, dass wir (je nach Kodierung) verschiedene Lösungen für unsere Abstände erhalten.

Intervallskala

Lassen sich die Ausprägungen unserer Daten bezüglich ihrer Abstände interpretieren, so sind die Daten mindestens intervallskaliert. Die Intervallskala ist dahingehend charakterisiert, als dass Sie keinen absoluten Nullpunkt besitzt. Zum Beispiel folgen Temperaturen (in °c oder °F) einer Intervallskala, denn 0 °C ≠ 0 °F. Ganz hingegen lässt sich die Temperatur in Celcius umrechnen zu 1.8 · 0 °C + 32 = 32 (° F). 0 °C sind also 32 °F.  Weiterhin besitzt die Intervallskala die Eigenschaft, dass mit ihr sinnvoll Summen und Differenzen gebildet werden können. Bei den beiden vorherigen Skalen ist dies nicht möglich.

Verhältnisskala

Lassen sich Daten dahingehend beschreiben, als dass wir beispielsweise sagen können, 2 Einheiten vom Merkmal sind doppelt soviel wie 1 Einheit, so sprechen wir von verhältnisskalierten Daten. Gewicht, Längen, Flächen, Kosten, Gewinne und die Temperatur in Kalvin (hier liegt ein absoluter Nullpunkt vor) sind Beispiele für verhältnisskalierte Daten. Mit dieser Skala sind alle mathematischen Operationen (Summen, Differenzen, Produkte und Verhältnisse) erlaubt.

Weiteres tu den Skalen

Abschließend können die 4 Skalenniveaus noch zu weiteren Skalen zusammengefasst werden. So werden Nominal- und Ordinalskala  zur topologischen Skala und Intervall- und Verhältnisskala  zur Kardinalskala bzw. metrischen Skala erweitert.

 Literatur

Bortz, J. (2005): Statistik für Human- und Sozialwissenschaftler, 6. Auflage, Springer, Heidelberg.

Büning, H. und Trenkler. G. (1994): Nichtparametrische statistische Methoden, 2. Auflage, Walter de Gruyter, Berlin.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.