====================
== Andreas Streim ==
====================
I am a digital resident and this is my ~

Making of ... Windräder in Brandenburg

Datenjournalismus Google Chart API Google Fusion Tables Google Maps Karte MAZ Windräder

Am vergangenen Donnerstag habe ich in der “Märkischen Allgemeinen” auf der Wissenschaft&Technik-Seite; einen Artikel darüber veröffentlicht, wo in Brandenburg die Windräder stehen und gleichzeitig beschrieben, wie wir aus öffentlich zugänglichen Daten die Visualierung vorgenommen haben.

Der Artikel beschreibt bereits einen Großteil der Arbeit. Hier noch einmal in der Übersicht und mit etwas mehr Hintergrund:

Die Anleitung

  • Am Anfang stand die Idee: Ein Kollege hat bei Recherchen für Erneuerbare Energien festgestellt, dass der ostdeutsche Stromnetzbetreiber 50Hertz die Daten für alle nach dem EEG geförderten Anlagen zum Download bereithält. Diese unübersichtlichen Datenblätter in etwas zu verwandeln, was sich auf einen Blick wahrnehmen lässt, war das Ziel.

  • Nachdem die Daten für die Windräder in Brandenburg runtergeladen waren, mussten die Angaben für eine Geokodierung aufbereitet werden. Ein erster Versuch, die List einfach in Google Fusion Tables zu laden und dort die Berechnung durchzuführen, war wenig erfolgreich. Die Adressangaben sind für Google Maps ungeeinget, da meistens keine Straße und Hausnummer angegeben ist, sondern ein Flurstück oder vage Bezeichnungen wie “An der B105”.

  • Wir haben uns daraufhin als Ziel gesetzt, die Windräder orts- bzw. ortsteilgenau auf die Karte einzuzeichnen, also nicht den exakten Standort des Windrads zu nehmen.

  • Auch dieser zweite Versuch scheiterte in Google Fusion Tables. Der Grund: Gibt es mehrere Einträge am selben Ort, so werden diese übereinander eingezeichnet, aber nur der letzte Eintrag ist überhaupt sichtbar und lässt sich anklicken.

  • Die erste Idee war dann, mit einem kleinen Programm die Daten zu durchforsten und eine Anzahl für jeden Ort zu berechnen, also z.B. dass in Ort ABC genau 22 Windräder stehen und entsprechend unterschiedliche Marker für bestimmte Anzahlen in die Karte einzutragen. Das Programm hat die Original-CSV-Datei eingelesen, bearbeitet und die für die Darstellung notwendigen Daten in eine neue CSV-Datei geschrieben.

  • Das von mir geschriebene Programm (in Python) hat soweit funktioniert, aber leider ergab sich daraus ein Nachteil: Obwohl in den Originaldaten das Jahr der Inbetriebnahme eingetragen war, hätte man auf diese Weise nicht eine Karte zum Stand von z.B. 2005 machen können, da die Zählung ja über die Gesamtdaten gelaufen ist und der Marker damit festgelegt war.

  • Die nächste, und letztlich umgesetzte Idee war dann, die Windräder doch einzeln zu betrachten - indem jedes um eine Winzigkeit auf der Karte versetzt eingezeichnet wird. Dazu wurde das Pyhton-Programm angepasst und hat die Anlagen sternförmig um den jeweiligen Ort- bzw. Ortsteil-Kern angeordnet.

  • Für die Geokodierung wurde jetzt nicht mehr Fusion Tables selbst genutzt, sondern die Google-API aus dem Pyhton-Programm heraus. Der Vorteil: Man erhält alle möglichen Treffer und m.E. bessere Ergebnisse.

  • Mit Hilfe der Filter-Funktion in Fusion Tables kann man nun die Ausgabe auf alle Anlagen beschränken, die z.B. im Jahr 2005 schon da waren. Oder 2006. 2007. Etc. Dadurch ergibt sich eine Übersicht über die Entwicklung der Anlagen:

  • Mit der Share-Funktion von Google Fusion Tables wurde die endgültige Karte freigegeben, die dann so aussieht.

  • Weil die Daten dann bereits maschinenlesbar aufbereitet vorliegen, habe ich mit einem weiteren Programm Auswertung vorgenommen, z.B. Wie viele Windräder sind jedes Jahr hinzugekommen? Wie ist die Gesamtleistung gewachsen? Das sind wenige Zeilen Programmcode - und dank der Google Chart API lassen sich diese Ergebnisse ebenfalls mit wenigen Zeilen in kleine Grafiken übersetzen:

    Windärder in Brandenburg
    Windräder in Brandenburg

Feedback

Neben freundlichem Feedback habe ich auch Kritik von echten Kartographen der Universität Potsdam bekommen. Zum einen würden einzelne Windanlagen fehlen (was wir noch nicht verifizieren konnten und ich mir eigentlich nicht vorstellen kann, da die Daten des Netzbetreibers eigentlich vollständig sein sollten). Zum anderen sei die Art der Visualisierung auf einer Karte problematisch. Der Nutzer würde z.B. an einem bestimmten Ort eine Windanlage suchen, nicht im Ortskern des jeweiligen Ortes (wo wir sie wegen der limitieren Adressdaten, s.o., eintragen). Der zweite Einwand ist sicherlich korrekt, aber uns ging es darum, bestimmte Muster zu zeigen und aus einem unübersichtlichen Datensatz Erkenntnisse zu gewinnen. Ich denke, das ist gelungen.

Previous Post Next Post