Oettinger-physics.de
URI QR-encoded:http://vorlesung.oettinger-physics.de/script/Hopfenkaltschale.html

Fallbeispiel Statistik - Bier

Fallbeispiel:

der Gegenwert einer Hopfenkaltschale

In Ravensburg findet jährlich das Rutenfest statt, ein traditionelles Schüler- und Stadtfest. Gerade Nicht mehr ganz aktuell (Mitte Juni 2013) veröffentlichte die lokale Presse, die Schwäbische Zeitung [3], einen Bericht, der sich mit einer der wichtigsten Fragen der Menschheit - nämlich der Entwicklung der Preise für einen Liter Bier beim Rutenfest - befasst. Interessant (lies: für den Statistiker) sind an diesem Artikel zwei Dinge, die wir uns exemplarisch etwas genauer vornehmen wollen: im Artikel genannte Zahlen, die die zeitliche Entwicklung beschreiben und eine Infografik, die diese Entwicklung darstellen soll.

Der Zahlenraum bis Zehn

Die Frage nach Qualität und Herkunft der Daten erübrigt sich hier: eine zeitliche Entwicklung innerhalb einzelner Jahre fand nicht statt, es existieren keine zufälligen Abweichungen einzelner Preise. Auch die Jahresangaben sind exakt und der Umfang der Stichprobe ist so gering, dass sie problemlos in Worte oder eine Tabelle gefasst werden kann - abgesehen von der Anzahl beste Voraussetzungen, um eine belastbare Statistik zu fertigen. Hier sind die relevanten Auszüge aus dem Artikel [1]

Nach Informationen der Schwäbischen Zeitung werden für die Rutenmaß in diesem Jahr 7,40 Euro fällig, zehn Cent mehr als 2012. [...]
Zwischen 2004 und 2009 stieg der Preis für die Maß jährlich um 20 Cent, bis er 2009 konstant blieb. Ein Jahr später erlebte Ravensburg die kuriose Situation, dass es zwei Bierpreise gab, da der Bärengarten einseitig eine um 40 Cent teurere Rutenmaß anbot.

Was lässt sich daraus ablesen? Sofort klar ist der Bierpreis für die Jahre 2013 (7,40) und 2012 (7,30). Die Bierpreise davor sind nicht genannt - aber die Differenz zum teureren Bier im Bärengarten (0,40). Der Bierpreis im Bärengarten wiederum wird im Text nicht erwähnt, man erfährt aber den Zeitraum, in dem sich der Preis linear entwickelt hat. Der Sinn der komplizierten und unvollständigen Information ist unklar, die Grafik zum Text liefert aber zumindest einige weitere Preise (2003: 5,90 ; 2006: 6,50 ; 2010: 6,70). Eine kurze Recherche oder ein Blick auf das Diagramm liefert den Bierpreis des Bärengarten im Jahr 2010 (7,10) und damit den zweiten Preis 2010 (6,70), weil der Preis laut Text ab dem Vorjahr konstant blieb, ist der Wert für 2009 ebenfalls bekannt (6,70). Damit müsste sich der Preis über die paar betrachteten Jahre rekonstruieren lassen.

Der Artikel enthält offensichtlich die Angaben zum Bierpreis der einzelnen Jahre (wenn auch etwas kompliziert). Das klingt doch nicht schlecht, oder?


Warum stehen die Daten in einem Artikel? Die im Text genannten Zahlen sollen den beschriebenen Sachverhalt und etwaige Folgerungen, hier natürlich auch die Aussagen der Grafik (s. u.) stützen. Sie sollten vollständig und in einfacher Form angegeben sein, so dass der Leser die Folgerungen leicht nachvollziehen kann - hier eher nicht.

Vielleicht hilft ja einfache Mathematik. Der Preis für 2010 ergibt sich aus dem Diagramm oder dem Preis im Bärengarten. Ab hier gibt es zwei Möglichkeiten, aus dem Anstieg der Preise auf die einzelnen Jahre zu schließen:

  • rechnet man von 2009 an abwärts über ein Absinken der Preise um -,20 pro Jahr bis 2004, ergeben sich die Werte in der zweiten Spalte der Tabelle. Der Preis im Jahr 2003 kann dann der Grafik entnommen werden.
  • Die zweite Möglichkeit ist, von 2003 an aufwärts zu rechnen - die so gefundenen Preise sind in der dritten Spalte angegeben.

Moment, vielleicht weiß die Suchmaschine unseres Vertrauens ja noch mehr (klar, es geht um eine der Fragen, die die Welt bewegen): relativ schnell kann man sich noch einige zusätzliche Angaben zum Bierpreis zusammenklauben (Angaben in DM sind direkt halbiert), sie sind in der letzten Spalte der Tabelle aufgeführt:

Jahr    Preis lt. Text entweder    Preis lt. Text oder    Preis lt. Grafik    höherer Preis    Preis Netz
1974    1,60
1992    3,65
1995    4,20
2003  5,90 5,90
20045,906,10   
20056,106,30   
20066,306,506,50  
20076,506,70   
20086,706,70   
20096,706,70   
20106,706,706,707,106,70
20117,107,10   
20127,307,30   
20137,407,40   
2014    7,60

Sofort fällt auf, dass die zweite Spalte nicht zum Diagramm passt: die Preise widersprechen sich im Jahr 2006, ein gleichbleibender Bierpreis im Jahr 2004 ist der Grafik definitiv nicht zu entnehmen. Rechnet man aber wie in der dritten Spalte aufwärts, so müsste der Preis bereits 2008 konstant geblieben sein.

Aus den Angaben im komplizierten Text lassen sich Preise im Diagramm offensichtlich nicht nachvollziehen - und das bei insgesamt zehn Werten. Nun gut, möglicherweise ist der Text einfach ungeschickt formuliert. Vielleicht sollten wir uns doch lieber an die Grafik halten.

Bilder sind gut - oder?

Wozu denn eigentlich?

Das Schaubild ist ein einzigartiges Demonstrationsmittel, da es schnelles und sicheres Erfassen auch komplizierter Zusammenhänge ermöglicht. Der Mensch unserer Zeit ist vorwiegend visuell veranlagt, der optische Eindruck erspart ihm die Mühe der gedanklichen Vorstellung. Die bildhafte Veranschaulichung wird heute deshalb mehr und mehr sowohl für wissenschaftliche Zwecke wie für die Wirtschaft, für Schulen wie für das breite Publikum verwendet (Schön, Willi: Das Schaubild. Möglichkeiten und Methoden der praktischen Anwendung, Forkel Verlag Stuttgart 1957)

Schaubilder oder Grafiken dienen auch in der Statistik dazu, Daten für den Menschen einfach und verständlich darzustellen. Man erfasst eine Aussage (beispielsweise eine zeitliche Entwicklung wie im vorliegenden Fall) deutlich leichter, wenn man sie visuell (und nicht in Form von Werten oder Zahlen) aufnehmen kann. In den Medien werden deshalb häufig Infografiken verwendet, die Information im vorgestellten Datenmaterial mit zusätzlicher Information im Hintergrund verbinden - das ist eine richtig gute Idee, die Schwäbische Zeitung versucht es in diesem Bild ebenfalls:

Entwicklung Bierpreis Rutenfest (Quelle: Schwäbische Zeitung)
Abb. 1 Quelle: Schwäbische Zeitung, Juni 2013 [2]

Das Bild im Hintergrund macht dem Betrachter schnell und einfach klar, dass es um Bier und um Geld geht - zusätzliche Information, die man sogar erfassen kann, ohne den Titel des Diagramms zu lesen. Das Plakat am Stiel ist - diplomatisch formuliert - eine Frage des persönlichen Geschmacks, das ist wirklich das aktuelle (2013) Plakat zum Rutenfest. Für Personen, die das wissen, transportiert es die Information, dass es um das Rutenfest geht. Damit ist bereits eine Menge Information im Hintergrund enthalten, die man intuitiv erfassen kann.

Der eigentlichen Grafik zur zeitlichen Entwicklung der Preise (der Diagrammteil der Infografik) kann man ebenfalls einige Information schnell und einfach entnehmen:

  • offensichtlich hat sich der Bierpreis seit 2003 nach oben entwickelt. Ganz ehrlich: alles andere wäre eigenartig.
  • man erfasst sofort, dass sich der Bierpreis deutlich nach oben entwickelt hat (das ist einer der Vorteile der grafischen Darstellung von Daten - man erkennt Verhätnisse und Tendenzen sehr leicht)
  • die Verbindungslinie zwischen den Datenpunkten hilft, die zeitliche Entwicklung zu verstehen (sie führt das Auge und transportiert wiederum ohne Verwendung von Zahlen Information). Es wird deutlich, dass der Anstieg der letzten drei Jahre relativ stark war

Die Zeitung liefert ein klassisches Beispiel dafür, wie die Wahrnehmung eines Sachverhalts durch optische Darstellung verändert werden kann. Die visuelle Darstellung führt dazu, dass man die Information über die Preise (Größen und Zusammenhänge, in der Grafik in den Koordinaten der Punkte versteckt) nicht mehr wahrnimmt. Stattdessen verlässt man sich auf den Eindruck, den die optische Darstellung in der Grafik vermittelt - dieser Eindruck ist in unserem Fall ein vollkommen anderer. Man erkennt es sofort, wenn man die bereits bekannten Preise der letzten Jahre in einem ehrlichen Diagramm darstellt - mit den Werten aus der zweiten Spalte der Tabelle oben (die laut dem Artikel zum Bierpreis im Jahr 2014 korrekt sind [6]) ergibt sich ein völlig anderes Bild für den Bierpreis:

Abb. 2: die Daten zum Bierpreis aus der Tabelle oben mit Regressionsgerade (Korrelationskoeffizient: 0,98).

Die Punkte im Diagramm geben die Preise für einen Liter Bier aus der Tabelle oben an, die blaue Linie ist eine (über lineare Regression nach der Methode der kleinsten Quadrate) angepasste Gerade. Die Qualität des linearen Zusammenhangs kann über den Korrelationskoeffizient nach Bravais-Pearson abgeschätzt werden, der in diesem Fall stolze 98% beträgt und damit ein starkes Argument für einen linearen Anstieg der Preise liefert. Das Diagramm und die Infografik der Zeitung geben denselben Zeitraum wieder - so unspektakulär ist der Bierpreis eigentlich.

Und was ist denn nun falsch an der Infografik? Das mit 'Entwicklung des Bierpreises auf dem Rutenfest' überschriebene Diagramm gibt nicht die Preise und noch weniger deren zeitliche Entwicklung wieder.

  • Abb. 3: Vergleich der Daten zum Bierpreis mit der Angabe in der Infografik.
    Die geschwungene Linie ist der Grafik entnommen.
    Die Verbindungslinie zwischen den Punkten ist ansprechend geschwungen, aber schlichtweg falsch. In Abb. 3 ist die Linie aus der Infografik mit den Preisen dargestellt - man vergleiche einfach den Anstieg der Preise und der Linie in den Jahren von 2003 bis 2006. Die Daten für die Jahre 2004, 2005, 2008 und 2009 wurden weggelassen, obwohl sie im Text sogar angegeben sind - das ist klassisches cherry-picking. Der Preis für 2006 ist falsch und der Grund dafür, dass von zwei Preisen 2010 einer willkürlich ignoriert wurde, bleibt im Dunkeln. Richtig, wenigstens der Preis selbst ist in Flohschrift angegeben.
    Resultat: von insgesamt 12 bekannten Preisen liegt lediglich die Hälfte auf der Kurve. Genau diese 6 Werte sind eingezeichnet.
  • Zusätzlich wurde ein Teil der vertikalen Achse einfach abgeschnitten, sie beginnt bei 5,50 Euro. Nicht so schlimm? Ein Preisanstieg von insgesamt 20,2% wird wegen der Skala von 5,50 bis 7,50 durch eine Höhenänderung von 75% dargestellt - das ist beinahe das vierfache (!). In der Kombination entwickelt sich aus der eigentlich recht gleichmäßigen, flach ansteigenden Kurve ein dramatisches Wertegebirge (das lässt sich wohl besser verkaufen).
  • Betrachtet man alle Daten, so erkennt man auch sofort, dass der Anstieg der letzten drei Jahre eben nicht besonders stark ausfiel. Er passt relativ genau in die Entwicklung der Preise seit 2003 (und ebenfalls in die Entwicklung seit 1974). Man erkennt, dass die Besonderheit eher der konstante Preis von 2009 und 2010 war.
    Die Darstellung der Infografik ("Preis in den letzten paar Jahren dramatisch angestiegen") verkehrt sich damit beinahe ins Gegenteil ("Bierverkäufer haben dem Rutenfest 2009 und 2010 ein Geschenk gemacht").
  • Abb. 4: einfache Abschätzung der erwarteten Bierpreise bei einer
    gemittelten Teuerung von 2% (grün) und 3% (blau) ab dem Jahr 2003.
    Und was ist mit dem optisch dramatischen Anstieg der Preise? Die Änderung von Preisen ist immer schwierig zu erheben, das Statistische Bundesamt [5] sammelt aber natürlich auch dazu Daten (beispielsweise hier: Preissteigerungsraten 1951-2007). Eine ganz grobe Schätzung liefert eine mittlere Teuerungsrate von 2% bis 3%, damit sind die beiden weiteren Datenreihen in diesem Diagramm errechnet:

    Startet man mit dem Bierpreis 2003 und legt einen Wert von 2% als mittlere Rate zugrunde, ergibt sich die grüne Gerade. Die erwarteten Preise liegen recht knapp unter den realen Preisen. Eine mittlere Rate von 3% liefert die blaue Gerade - die erwarteten Preise liegen bereits deutlich darüber. Diese simple Abschätzung weist darauf hin, dass sich die Bierpreise eher nicht überdurchschnittlich entwickelt haben.

Fazit

Was kann man denn jetzt nachvollziehbar aus den Zahlen oben schließen? Erstens: 2013 wurde auf dem Rutenfest Bier verkauft. Zweitens: der Preis für einen Liter war 7,40 Euro. Drittens: ähh, ja, nö, der Preis entwickelt sich wie erwartet...

Was macht die Presse daraus? Zehn einfache Zahlen sind im Text so wiedergegeben, dass ich sie nicht nachvollziehen kann. Die Hälfte der Daten wurde im Diagramm weggelassen, die zeitliche Entwicklung völlig verdreht dargestellt. Die Verbindungslinie in der Infografik stellt was genau dar? Hausnummern? Die offizielle Mondzeit? Egal, sie ist ganz toll bunt und wirkt sensationell...

Chapeau, Schwäbische, ich bin beeindruckt.

Update 2014

Die Schwäbische Zeitung kann das viel besser - inzwischen gibt es den Nachfolgeartikel für das Jahr 2014, in dem die Preise einfach und korrekt wiedergegeben sind [6]:

Vor zehn Jahren mussten die Rutenfestbesucher noch 5,90 Euro für die Maß bezahlen, seither gab es, mit einer kurzen Phase der Konstanz, regelmäßige Erhöhungen, meistens um 20 Cent. 2005 kletterte der Preis auf 6,10 Euro, im Jahr darauf auf 6,30 Euro, 2007 auf 6,50 Euro und 2008 auf 6,70 Euro. Auf dieser Höhe hielt sich der Preis konstant bis einschließlich 2010, das Jahr, in dem der Bärengarten ausscherte und einen um 40 Cent höheren Betrag verlangte. 2011 überraschte es da niemanden, dass die anderen Festwirte nachzogen.
Das frei erfundene Diagramm ist im Artikel 2014 ersatzlos gestrichen. Damit wird auf einmal vernünftige Statistik aus den Daten - vielen Dank, Schwäbische!