Analyse des Wegwerfverhaltens von Lebensmitteln?

Heute etwas angewandte Statistik. Das heutige Thema dieser Auswertung ist eine Debatte, die im Oktober 2011, kurzzeitig im Bundestag entbrannt ist. Es ist zwar nicht mehr so stark medial präsent. Dennoch sehr interessant. Die Analyse habe ich damals zu Studienzeiten selbst durchgeführt. Sie war Teil einer Seminararbeit.

Die Debatte

Die Deutschen "werfen soviel Lebensmittelweg, da sie das Mindesthaltbarkeitsdatum mit dem Verbrauchsdatum verwechseln", so Hans-Michael Goldmann (FDP). Natürlich sind hierbei nicht verdorbene Nahrungsmittel gemeint. Das Wegwerfen von Lebensmitteln ist tatsächlich ein Problem,  unabhängig von den potenziellen Ursachen. Somit hat die Politik natürlich hierfür einen Lösungsansatz parat. Nach Goldmann solle die Bezeichnung des Mindesthaltbarkeitsdatums (MHD) in Anlehnung an das Vereinigte Königreich (von Großbritannien) in Best Before oder einen hierfür entsprechenden deutschen Begriff geändert werden.

Widersprüchlich wirkt auf mich der Lösungsansatz, da in dem Vereinigten Königreich ebenfalls zwei Lebensmittelkennzeichnungen existieren: Best Before (BB) und Use By. Wobei ersteres das Analogon zum MHD und das zweitgenannte von der Bedeutung analog zu dem Verbrauchsdatum zu verstehen ist. Ganz nebenbei, galt dieser Sachverhalt (2 Kennzeichnungen) zur Zeit der Analyse für alle damaligen EU-Mitgliedsstaaten. Vielmehr splitten sich bei späteren Recherchen die EU-Mitglieder in 2 Gruppen bezüglich der Kennzeichnungen auf. Die MHD- und die BB-Länder.

Weiterhin muss erwähnt werden, dass das MHD nichts über die Verderblichkeit eines Lebensmittel aussagt. Es bezieht sich ausschließlich auf den Erhalt gewisser industrieller Kriterien. Zum Beispiel garantiert ein Hersteller mit dem MHD, dass sein Produkt, ungeöffnet, seine Konsistenz mindestens bis zu jenem Datum erhält. Demgegenüber sagt das Verbrauchsdatum etwas über den Verfall aus. Leicht verderbliche Lebensmittel, wie zum Beispiel Rohmilch oder Geflügel, werden damit versehen.

Die Untersuchung

Die Daten

Wie untersucht man nun diese Fragestellung? Zunächst habe ich mich darum bemüht, geeignete Daten für diese Untersuchung zu beschaffen. Nach längeren Recherchen bin ich in der Datenbank von EUROSTAT fündig geworden. Hierbei handelt es sich um Daten zu dem  geschätzten jährlichen Aufkommen von Biomüll für unsere EU-Mitgliedsstaaten auf Haushaltsebene. Diese Daten sind nicht ganz ideal, da Biomüll nicht notwendigerweise weggeworfene Lebensmittel bedeutet. Vielmehr fließen dort ganz allgemein pflanzliche und tierische Abfälle ein. Das bedeutet, dass beispielsweise  Abfälle bei Gartenarbeiten in diesen Daten vorhanden sind. Nichtsdestotrotz waren dies die brauchbarsten Daten, die gefunden werden konnten. Diese Daten lagen für drei Jahre (2004, 2006 und 2008) vor.

erste Analysen

Welche Ländern werfen wieviel weg?

Bei einer ersten Analyse zeigte sich folgendes Bild:

Graf

 Abbildung 1: Die produzierte Biomüllmenge für 17 EU-Mitgliedsstaaten. Die Hilfslinien sind zur Orientierung "per Hand" eingezeichnet worden.

Die Grafik lässt für alle drei Jahre "Cluster" von Ländern erkennen. Länder, die pro Kopf unter 25 kg, zwischen 25 und 75 kg und über 75 kg jährlichen Biomüll auf Haushaltsebene erzeugen. Was dieses Bild vermuten lässt, zeigt sich in unterer Tabelle. Es sind jedes Jahr etwa die gleichen Länder, die in die jeweiligen "Cluster"  fallen:

2004   2006 2008

Belgien

115.00  90.00  92.00

Tschechische Republik 

6.00  11.00  13.00

Deutschland 

52.00 93.00 98.00

Estland 

1.00  1.00  8.00

Frankreich 

42.00  47.00  53.00

Italien 

38.00  46.00  55.00

Litauen 

4.00  0.00  5.00

Luxemburg 

129.00  132.00  147.00

Ungarn 

10.00  5.00  6.00

Malta 

5.00  6.00  4.00

Niederlande 

111.00  104.00  105.00

Österreich 

67.00  81.00  87.00

Slowenien 

6.00  13.00  21.00

Finnland 

12.00  3.00  34.00

Schweden 

39.00  43.00  54.00

Vereinigtes Königreich 

38.00  53.00  65.00

Norwegen 

53.00  59.00  67.00

Tabelle 1: Die produzierte Biomüllmenge für 17 EU-Mitgliedsstaaten. Grün markiert sind die Mengen jährlichen Biomülls, die weniger als 25 kg, blau markiert sind jene, die zwischen 25 kg und 75 kg und orange markiert sind die Mengen, die mehr als 75 Kg betragen.

Wird Tabelle 1 genauer betrachtet, so fällt auf, dass tendenziell stärkere Volkswirtschaften eine höhere Menge an Biomüll erzeugen als schwächer Volkswirtschaften. Deutschland, Österreich und die Benelux-Länder fallen für so gut wie jedes Jahr in die Gruppe der Top-Biomüll-Produzenten. Ein mittleres Niveau an Biomüll erzeugen diesen Daten zu Folge Frankreich, Italien, Schweden, das Vereinigte Königreich und Norwegen. Die Tschechische Republik, Estland, Litauen, Ungarn, Malta, Slowenien, tendenziell schwächere Volkswirtschaften und Finnland sind in den meisten Jahren, die Länder, die weniger als 25 Kg Biomüll produzieren. Eine weitere Untersuchung wird nur noch die Daten aus dem Jahr 2008 betrachten.

Besteht ein Zusammenhang zwischen BIP und der weggeworfenen Menge?

Greifen wir den obigen Gedanken mit der  angedeuteten Korrelation zwischen der jährlich produzierten Menge an Biomüll und der "Stärke" einer Volkswirtschaft auf. Die nachfolgende Tabelle zeigt uns das Streudiagramm des Bruttoinlandsprodukts (BIP) und der produzierten Menge an Biomüll für das Jahr 2008. Es ist deutlich ein positiver Zusammenhang zwischen der weggeworfenen Menge an Biomüll und dem pro Kopf BIP zu erkennen.

streudiagramm

Abbildung 2: Streudiagramm zwischen der pro Kopfmenge an erzeugtem Biomüll (y-Achse) und pro Kopf BIP für das Jahr 2008 (x-Achse).

Der Korrelation nach Pearson zwischen der produzierten Biomüllmenge und dem BIP beträgt 0,829. Dies spricht für einen starken positiven linearen Zusammenhang.

Ein weiteres Vorgehen sah vor, den Biomüll in Abhängigkeit von der Haltbarkeitskennzeichnung, dem BIP und weiteren Variablen (von denen angenommen wurde, das sie einen Einfluss ausüben konnten) zu modellieren. Hierbei wurde sich für die Γ-Regression entschieden, Γ ist das Zeichen für das griechische große Gamma. Bei der Wahl der Modellierung spielten inhaltliche Gründe mit. Eine  Γ-verteilte Zufallsvariable nimmt Werte größer/gleich Null an und ebenso kann dies nur die produzierte Menge an Biomüll annehmen. Wir können nicht weniger als nichts wegwerfen. Weiterhin zeigt sich folgendes Bild, wenn man die Daten an eine Γ-verteilte Zufallsvariable anpasst. Die Parameter der Γ-Verteilung sind aus den vorliegenden Daten per Maximum-Likelihood-Methode geschätzt worden.

anpassung4

Abbildung 3: Die theoretischen Quantile gegen die empirischen Quantile.

Im obigen Q-Q-Plot sind die Quantile der angepassten Γ-Verteilung gegen die empirischen Quantile der Biomüll-Stichprobe abgetragen.  Es ist schön zu erkennen, dass die Punkte nahe an der Winkelhalbierenden (Liegen die Punkte genau auf dieser Geraden, so stimmen die theoretischen und empirischen Verteilungen genau überein) verlaufen. Zwar sind gewisse Schwankungen zu beobachten und ein Punkt, der extrem von der Geraden abweicht. In Anbetracht des geringen Stichprobenumfangs sieht der fit dennoch gut aus. Insgesamt ist die Anpassung an eine Γ-Verteilung inhaltlich, wie auch analytisch sinnvoll.

Das Modell

Nachdem sich über Literaturrecherche Studien finden ließen, die das Thema von weggeworfenen Lebensmittel untersuchten, konnten einige potenziell einflussreiche Variablen erhoben werden. Als erklärende Variablen kamen folgende Größen für eine Modellierung der pro Kopf Menge an Biomüll in Frage: Das pro Kopf BIP (aus Voruntersuchungen und anderen Studien), Anteil alleinstehender Männer (diese Bevölkerungsgruppe soll laut anderen Studien einen hohen Einfluss auf die weggeworfene Menge an Lebensmittel haben), das Einkommen alleinstehender Männer und die Haltbarkeitskennzeichnung (MHD oder Best Before, laut Goldmann). Sicherlich sind mehr Einflüsse denkbar. Wegen des kleinen Stichprobenumfangs, sollte das Modell sparsam gewählt werden; was aber auch bei großen Stichprobenumfängen zu empfehlen ist.

Ergebnisse

Schätzer Standardfehler Wald-Teststatistik   df p

Achsenabschnitt

4.57141 1.24913 13.4 1 0.00025

BIP/Einkommen Männer

-0.00128 0.00040 10.3 1 0.00130

Anteil alleinstehender Männer

0.12571 0.04719 7.1  1 0.00770

Kennzeichnung

-0.64430 0.34686 3.5 1 0.06300

Maximum likelihood pseudo R²

0.786941

Tabelle 2: Ergebnisse der Γ-Regression. Die abhängige Variable ist der pro Kopf Biomüll. Die Verteilung der Teststatistik haben einen Freiheitsgrad.

Die Variable BIP/ Einkommen Männer ist der Quotient aus dem pro Kopf BIP und dem durchschnittlichen Einkommen alleinstehender Männer. Der Quotient dieser beiden Variablen wurde in das Modell aufgenommen, da bei einer ersten Modellierung, mit diesen beiden Variablen, ein Multikollinearitätsproblem vorlag. Auch die hohe Korrelation von 0.94834 zwischen diesen Variablen deutet auf ein ernst zu nehmendes Kollinearitätsproblem hin. Da die beiden Variablen inhaltlich, wie auch analytisch die abhängige Variable erklären, wurde aus ihnen der Quotient gebildet, um das Kollinearitätsproblem einzudämmen und um den Erklärbeitrag im Modell zu behalten. Dies ist tatsächlich gelungen, vergleiche Tabelle 3.

vorher nachher

BIP

16.26796

durchschnittliche Einkommen alleinstehender Männer

11.51021

BIP / Einkommen Männer

1.39759

Anteil alleinstehender Männer

4.31400 1.60438

MHD

1.31877 1.20066

Tabelle 3:  Varianzinflationsfaktoren (VIF) (Kollinearitätsmaß) vor und nach der Transformation der Variablen. Als Faustregel gilt VIF größer 10, deuten auf ein Multikollinearitätsproblem hin.

Widmen wir uns wieder der Tabelle 2, so ist zu erkennen, dass die Art der Haltbarkeitskennzeichnung einen negativen Einfluss auf die pro Kopfmenge an Biomüll ausübt. Dies würde zunächst Goldmanns These bestätigen, da in der Kennzeichnungsvariablen 0 für MHD und 1 für Best Before steht. Dieser Einfluss ist aber nicht signifikant, p < 0.05, weswegen sich  Goldmanns Behauptung nicht zeigen lässt. Das pseudo R² liefert einen Wert in Höhe von etwa 0.79. Dies deutet auf eine hohe Modellanpassung hin. Diese Kennzahl ist ähnlich zu interpretieren, wie das gewöhnliche Bestimmtheitsmaß. Es wird also ein hoher Anteil der Varianz des Biomülls durch unsere unabhängigen Variablen erklärt.

Prüfung der Annahmen

Um die Regressionsannahmen zu überprüfen, werden Residualplots betrachtet. In ihnen kann abgelesen werden, ob die Annahmen der Linearität (Auch das ist eine Annahme der verallgemeinerten linearen Regression, dann bezogen auf die sogenannte Linkfunktion. Mit), keine Autokorrelation und Heteroskedasizität erfüllt sind. Die letztere Annahme betrifft unsere Tests im Regressionsmodell.

Residualplot

Abbildung 4: Residualplot. Die Hilfslinien sind "per Hand" eingezeichnet worden und dienen der Orientierung.

In Abbildung 4 sind die Deviance Residuen gegen die logarithmierte abhängige Variable abgetragen. In einem verallgemeinerten linearen Modell haben die gewöhnlichen Residuen in der Regel keine konstanten Varianzen, weswegen sich im verallgemeinerten linearen Modell spezieller Residuen bedient wird. Diese Residuen sind gegen den logarithmierten pro Kopf Biomüll geplottet worden, da als Link-Funktion für das verallgemeinerte lineare Modell der natürliche Logarithmus gewählt wurde. In einem verallgemeinerten linearen Modell (auch Probit, Logit, etc. sind verallgemeinerte lineare Modelle) wird die Zielvariable nicht direkt modelliert, sondern eine Funktion der Zielvariablen. Das heißt log(y) = beta_0 + beta_1cdot x_1 + dots + beta_kcdot x_k wird modelliert, so dass wir einen linear additiven Zusammenhang modellieren, so wie bei der gewöhnlichen Regression, aber mit einer "transformierten" Zielvariablen. Der Einfluss auf die Zielvariable direkt ist exponentiell multiplikativ, da bei Anwendung der Exponentialfunktion und ihren Rechenregeln gilt:  y =exp{beta_0 + beta_1cdot x_1 +dots beta_kcdot x_k}=exp{beta_0}cdotexp{beta_1cdot x_1}cdotdotscdotexp{beta_kcdot x_k}.

Die Residuen streuen ohne Struktur und gleichmäßig um 0. Somit ist hier keine Verletzung der Regressionsannahmen zu erkennen. Eine weitere Überprüfung der Modellannahmen erfolgt über Abbildung 5. Hier ist die Verteilung der Deviance Residuen überprüft worden. Diese sollten wie im gewöhnlichen linearen Modell einer Normalverteilung folgen. Auch hier ist keine Verletzung der Annahme zu erkennen, sodass die Ergebnisse der Test valide erscheinen.

.Residualplots-verteilung

Abbildung 4: Die Verteilung der Deviance Residuen.

Die Ergebnisse und Ausblick

Auf Basis dieser Ergebnisse hat die Art und Weise der Haltbarkeitskennzeichnung keinen Einfluss auf das Wegwerfverhalten. Hinsichtlich der Datenlage konnte dies aber nicht vollständig geklärt werden. Weiterhin konnte nachgewiesen werden, dass die Menge an Biomüll und die Wirtschaftsleistung eines Landes korrelieren. Auch in anderen Studien wurde dieser Zusammenhang thematisiert. So soll sich das Überangebot an Lebensmitteln im Handel  auf das Wegwerfverhalten der Bevölkerung auswirken.

Ebenfalls deutet eine Studie der Österreichischen Gesellschaft für Umwelt und Technik darauf hin. Hier wurden von den Befragten als Gründe für ein Wegwerfen von Lebensmitteln Schimmelbildung (95 %) und gesundheitliche Bedenken an (81 %). Der Ablauf des MHD wurde hingegen von insgesamt 28 % der Befragten genannt. Weiterhin kommen viele Studien zu dem Schluss, dass vor allem junge Personen eher dazu neigen, Lebensmittel wegzuwerfen, als ältere Personen. Sie sind mit dem Überangebot aufgewachsen, weswegen anzunehmen ist, dass Lebensmittel in dieser Generation einen geringeren Stellenwert einnehmen als bei älteren Menschen.

Literatur

Fahrmeir, L. Kneib, T. und Lang, S. (2009), Regression. Modelle, Methoden und Anwendungen, 2. Auflage, Springer, Berlin.

Hardin, J. und Hilbe, J. (2001), Generalized linear models and extensions, 1. Auflage, Stata Press, College Station.

Kranert, M., Hafner, G., Barabosz, J., Schneider, F., Lebersorger, S., Scherhaufer, S., Schuller, H. und Leverenz, D. (2012), Ermittlung der weggeworfenen Lebensmittelmengen und Vorschläge zur Vermeidung der Wegwerfrate bei Lebensmitteln in Deutschland -Kurzfassung-, Universität Stuttgart, Institut für Siedlungsbau, Wassergüte- und Abfallwirtschaft im Auftrag des Bundesministeriums für Ernährung, Landwirtschaft und Verbraucherschutz.

McCullagh, P. und Nelder, J. A. (1989), Generalized linear models, 2. Auflage, Chapman and Hall, London.

Montgomery, D. C. und Peck, E. A. (1982), Introduction to linear Regression analysis, 1. Auflage, John Wiley & Sons, New York.

Österreichische Gesellschaft für Umwelt und Technik (2012), Haltbarkeit von Lebensmitteln. Maßnahmen zur Vermeidung Lebensmittelabfällen, Eine Studie im Auftrag der Wiener Umweltschutzabteilung - MA 22.

R Development Core Team (2011), R: A language and enviroment for statistical computing. R foundation for statistical computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org/

Internetquellen

AK.Portal. Portal der Arbeiterkammer Österreich, www.arbeiterkammer.at (21.01.2012).

Deutscher Bundestag,  www.bundestag.de (30.11.2011).

Europa. Das Portal der Europäischen Union, www.europa.eu/index_de.htm (21.01.2012).

Europäisches Verbraucherzentrum Deutschland-Kiel, http://www.eu-verbraucher.de/de/startseite/ (21.01.2012).

Eurostat, http://ec.europa.eu/eurostat/help/new-eurostat-website (20.11.2011).

SAVE FOOD Studie|Cofresco, www.cofresco.de (30.11.2011).

U. S. Census Bureau, www.census.gov (20.11.2011).

Ein Gedanke zu „Analyse des Wegwerfverhaltens von Lebensmitteln?“

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.