Mitmachprojekt: Frostbeulen, zieht nach Österreich!
Unsere Leser haben an ihren Arbeitsstellen Temperaturen gemessen, wir haben die Daten ausgewertet. Dabei haben wir nicht nur einiges über die Bürotemperaturen unserer Leser gelernt, sondern auch über aktuelle Statistik- und Geografiewerkzeuge. Eine interessante Erkenntnis kam vollkommen unerwartet.
Als wir Anfang des Jahres 2016 unser Projekt zur Messung der Bürotemperatur konzipierten, verfolgten wir damit als Redaktion mehrere Ziele: Wir wollten unsere Leser zur Beschäftigung mit Elektronik animieren und uns dabei ganz praktisch mit Datenjournalismus auseinandersetzen. Das Thema Bürotemperatur schien uns dafür ideal, denn es betrifft viele unserer Leser, und ein wenig Statistik kann wohl in mancher Bürodebatte äußerst nützlich sein. Wir glauben, alle Ziele erreicht zu haben. In unserer Auswertung wollen wir nicht nur auf die reinen Temperaturwerte und Statistiken eingehen, sondern auch auf die vielen, zum Teil unerwarteten Herausforderungen, die dabei auftraten.
Ein erster Überblick
- Mitmachprojekt: Frostbeulen, zieht nach Österreich!
- Die Programmiersprache für Statistikfans
- Geoencoding hilft uns weiter
- Der European Office Contest
- Die Außentemperatur im Vergleich
- Wie viele haben denn nun gemessen?
- Was wir gelernt haben
Für unsere Auswertung haben wir die Werte vom 19. April bis zum 31. August 2016 zugrunde gelegt. In dieser Zeit erhielten wir fast 4,4 Millionen Messwerte.
Wir ließen unseren Lesern die Wahl, inwieweit sie Informationen zu ihrem Messstandort preisgaben. So wissen wir, dass in neun verschiedenen Ländern gemessen wurde, für uns vollkommen überraschend nicht nur in Europa, sondern auch in Kanada und Indien. Bereitwillig wurde auch die Stadt angegeben, so finden sich 215 verschiedene Städtenamen in der Datenbank. Noch mehr Vielfalt gibt es bei den Postleitzahlen, wir finden 309 verschiedene Werte. 245 Leser gaben Breiten- und Längengrad an. Diese Werte sind aber mit Vorsicht zu betrachten, wie wir später herausfanden. Über einen zufallsgenerierten Token konnten Leser ihre Messstation anonym, zu Statistikzwecken aber eindeutig identifizieren lassen. 406 Tokens wurden verwendet. Praktisch alle Leser, die eine Ortsinformation übermittelten, nutzten auch einen Token.
Sieben Nutzer oder mehr?
Die Frage, wie viele Nutzer überhaupt teilnahmen, ist auf den ersten wie auch den zweiten Blick schwer zu beantworten. Hinter den Messwerten ohne Token können 10 wie auch 1.000 Messstationen stecken. Wir greifen zu einem ersten Trick, um uns der Zahl zu nähern. Wir ermitteln, wie oft Nutzer mit Token Messwerte ablieferten und bestimmen den Median-Wert. Ein typischer Token-Nutzer übermittelte 2.166 Messwerte. Wir haben knapp 15.000 Messwerte ohne Token. Nach dieser Logik verstecken sich hinter den vollständig anonymen Messwerten also gerade einmal um die sieben Nutzer. Insgesamt bleibt es also bei schätzungsweise rund 400 Teilnehmern. Wie halten aber die Zahl von 2.166 Messwerten bei Nicht-Token-Nutzern für deutlich zu hoch. Wir haben noch eine andere Idee, der wir uns später zuwenden.
Zur Einordnung: Als wir mit dem Projekt begannen, wünschten uns Kollegen mit mehr Erfahrung im Datenjournalismus und bei Nutzerbefragungen viel Glück - sie nannten schon 100 ernsthafte Teilnehmer ein optimistisches Ziel. Unsere Anforderungen an die Elektronik- und Programmierkenntnisse sowie unsere vermeintlich kleine Zielgruppe schienen ihnen eine zu große Hürde.
Raspberry Pi als Elektronikplattform weit vorn
Werfen wir zunächst noch einen Blick auf leichter zu ermittelnde Statistikdaten. Wir baten auch um die Angabe der verwendeten Elektronikplattform. Dabei liegen die Bastelcomputer wie der Raspberry Pi weit vorn, mit ihnen wurde die Hälfte der Messwerte ermittelt. Mikro-Controller-Boards wie Arduinos und Funkmodule wie der ESP8266 kommen zusammen nicht einmal auf ein Viertel. Interessanterweise spiegelt diese Verteilung auch das Leserinteresse an den zugehörigen Anleitungsartikeln wider.
Für die Analyse haben wir dann aber keinen Raspberry Pi eingesetzt, auch wenn die genutzten Programme auch darauf laufen. Auf einem Laptop mit einem Intel i7 ist es doch angenehmer, mit größeren Datenmengen zu arbeiten.
Die Programmiersprache für Statistikfans |
Seit Golem.de nur noch über SSL läuft, funktioniert mein kleiner ESP leider nicht mehr...
Weil das Luftfeuchte, also verdampftes Wasser, ist. So wie man bei kochendem Wasser...
Da danken wir doch ganz besonders!
Vielen Dank und der Fehelr ist gefixt!