Eine Timeline zum #BER

Ich hatte vor ziemlich genau einem Jahr einmal einen Beitrag geschrieben, was man mit dem Timeline-Tool Timeline so machen kann. Damals hatte ich damit herumgespielt, um eine Chronologie zur Eröffnung des neuen Großflughafens BER in Schönefeld für die “Märkische Allgemeine” zu erstellen.

Nun, der Flughafen ist ja dann nicht eröffnet worden, erstmal. Aber die Timeline mit den Daten ist nun doch noch online gegangen. Sie ist jetzt optisch sicher nicht super beeindruckend, aber ich freue mich, dass die inzwischen von den Kollegen fleißig ergänzte Arbeit doch noch ihren Weg ins Netz gefunden hat:

BER-Timeline

BER-Timeline

Making of … Windräder in Brandenburg

Am vergangenen Donnerstag habe ich in der “Märkischen Allgemeinen” auf der Wissenschaft&Technik-Seite einen Artikel darüber veröffentlicht, wo in Brandenburg die Windräder stehen und gleichzeitig beschrieben, wie wir aus öffentlich zugänglichen Daten die Visualierung vorgenommen haben.

Der Artikel beschreibt bereits einen Großteil der Arbeit. Hier noch einmal in der Übersicht und mit etwas mehr Hintergrund:

  • Am Anfang stand die Idee: Ein Kollege hat bei Recherchen für Erneuerbare Energien festgestellt, dass der ostdeutsche Stromnetzbetreiber 50Hertz die Daten für alle nach dem EEG geförderten Anlagen zum Download bereithält. Diese unübersichtlichen Datenblätter in etwas zu verwandeln, was sich auf einen Blick wahrnehmen lässt, war das Ziel.
  • Nachdem die Daten für die Windräder in Brandenburg runtergeladen waren, mussten die Angaben für eine Geokodierung aufbereitet werden. Ein erster Versuch, die List einfach in Google Fusion Tables zu laden und dort die Berechnung durchzuführen, war wenig erfolgreich. Die Adressangaben sind für Google Maps ungeeinget, da meistens keine Straße und Hausnummer angegeben ist, sondern ein Flurstück oder vage Bezeichnungen wie “An der B105″.
  • Wir haben uns daraufhin als Ziel gesetzt, die Windräder orts- bzw. ortsteilgenau auf die Karte einzuzeichnen, also nicht den exakten Standort des Windrads zu nehmen.
  • Auch dieser zweite Versuch scheiterte in Google Fusion Tables. Der Grund: Gibt es mehrere Einträge am selben Ort, so werden diese übereinander eingezeichnet, aber nur der letzte Eintrag ist überhaupt sichtbar und lässt sich anklicken.
  • Die erste Idee war dann, mit einem kleinen Programm die Daten zu durchforsten und eine Anzahl für jeden Ort zu berechnen, also z.B. dass in Ort ABC genau 22 Windräder stehen und entsprechend unterschiedliche Marker für bestimmte Anzahlen in die Karte einzutragen. Das Programm hat die Original-CSV-Datei eingelesen, bearbeitet und die für die Darstellung notwendigen Daten in eine neue CSV-Datei geschrieben.
  • Das von mir geschriebene Programm (in Python) hat soweit funktioniert, aber leider ergab sich daraus ein Nachteil: Obwohl in den Originaldaten das Jahr der Inbetriebnahme eingetragen war, hätte man auf diese Weise nicht eine Karte zum Stand von z.B. 2005 machen können, da die Zählung ja über die Gesamtdaten gelaufen ist und der Marker damit festgelegt war.
  • Die nächste, und letztlich umgesetzte Idee war dann, die Windräder doch einzeln zu betrachten – indem jedes um eine Winzigkeit auf der Karte versetzt eingezeichnet wird. Dazu wurde das Pyhton-Programm angepasst und hat die Anlagen sternförmig um den jeweiligen Ort- bzw. Ortsteil-Kern angeordnet.
  • Für die Geokodierung wurde jetzt nicht mehr Fusion Tables selbst genutzt, sondern die Google-API aus dem Pyhton-Programm heraus. Der Vorteil: Man erhält alle möglichen Treffer und m.E. bessere Ergebnisse.
  • Mit Hilfe der Filter-Funktion in Fusion Tables kann man nun die Ausgabe auf alle Anlagen beschränken, die z.B. im Jahr 2005 schon da waren. Oder 2006. 2007. Etc. Dadurch ergibt sich eine Übersicht über die Entwicklung der Anlagen:
  • Mit der Share-Funktion von Google Fusion Tables wurde die endgültige Karte freigegeben, die dann so aussieht.
  • Weil die Daten dann bereits maschinenlesbar aufbereitet vorliegen, habe ich mit einem weiteren Programm Auswertung vorgenommen, z.B. Wie viele Windräder sind jedes Jahr hinzugekommen? Wie ist die Gesamtleistung gewachsen? Das sind wenige Zeilen Programmcode – und dank der Google Chart API lassen sich diese Ergebnisse ebenfalls mit wenigen Zeilen in kleine Grafiken übersetzen:

Neben freundlichem Feedback habe ich auch Kritik von echten Kartographen der Universität Potsdam bekommen. Zum einen würden einzelne Windanlagen fehlen (was wir noch nicht verifizieren konnten und ich mir eigentlich nicht vorstellen kann, da die Daten des Netzbetreibers eigentlich vollständig sein sollten). Zum anderen sei die Art der Visualisierung auf einer Karte problematisch. Der Nutzer würde z.B. an einem bestimmten Ort eine Windanlage suchen, nicht im Ortskern des jeweiligen Ortes (wo wir sie wegen der limitieren Adressdaten, s.o., eintragen). Der zweite Einwand ist sicherlich korrekt, aber uns ging es darum, bestimmte Muster zu zeigen und aus einem unübersichtlichen Datensatz Erkenntnisse zu gewinnen. Ich denke, das ist gelungen.

Elfeinhalb Jahre, ein Bild

Seit 1999 arbeite ich – mit einer kurzen Unterbrechung – bei der “Märkischen Allgemeinen” (MAZ) in Potsdam. Die vergangenen Jahre lag bei mir immer ein riesiger Zeitungsstapel in der Wohnung. In den Ausgaben waren Artikel von mir, die ich unbedingt noch ausschneiden musste, um sie dann wieder auf Papier zu kleben und in Ordner abzuheften. Um das aufzubewahren, was man tagein, tagaus an doch sehr vergänglichem Tageszeitungsjournalismus schafft.

Gestern habe ich den großen Papierstapel weggeworfen.

Seit Sommer 2001 hat die MAZ nämlich ein elektronisches Archiv – und ich habe mir jetzt alle meine Artikel auf meine Festplatte heruntergeladen. (Das ist nicht ganz so einfach wie es klingt, weil mein Autorenkürzel “ast” als “Ast” in vielen Texten vorkommt, die mit mir nichts zu tun haben. Aber mit ein bisschen Logik, sogenannten regulären Ausdrücken, und der Programmiersprache Python kein unüberwindbares Hindernis. Ein wirklich guter Grund, warum Journalisten programmieren können sollten.)

Und wenn man dann seine ganzen Texte digital vor sich liegen hat, dann kann man plötzlich Fragen beantworten, die einen Journalisten immer umtreiben:

Was schreib ich denn eigentlich so?

Oder in diesem Fall: Was schreibe ich denn eigentlich am meisten?

Dazu habe ich alle meine Texte in einen großen Text gekippt (bzw. ein dafür geschriebenes Programm hat das gemacht) und diesen dann bei Wordle in eine Wortwolke umwandeln lassen.

Die am häufigsten benutzten Worten mit Ausnahme von Standard-Wörtern der deutschen Sprache wie “und”, “auf”, “im” etc. pp. werden dabei in einer Grafik dargestellt. Je größer das Wort, desto häufiger ist es im Vergleich zu den anderen benutzt worden. Und so sieht die Wortwolke meiner MAZ-Artikel von Sommer 2001 bis heute aus:

Für einen Wirtschaftsredakteur ist das Wort “Prozent” (dicht gefolgt von Euro) als am häufigsten benutztes vielleicht nicht so ungewöhnlich, ich hätte aber vorher nicht darauf getippt.

Mal sehen, was sich mit dem digitalen Datenschatz an Artikeln sonst noch so anstellen lässt, in den nächsten Tagen und Wochen.

[Update 23.30 Uhr: Durch eine technische Panne (naja, einen Fehler im Programm) wurden beim ersten Wordle nur etwa drei Viertel der Artikel berücksichtigt. Jetzt sind es alle.]

[Update 6.4.2012: So, nochmal die Datenbasis überarbeitet und das Wordle neu erzeugt.]

Auf der anderen Seite

Journalisten schreiben in der Regel nicht über sich selbst, sondern über andere. Wirtschaftsjournalisten wie ich schreiben oft über Firmen. Produkte, Entwicklungen, Veränderungen – aber auch Übernahmen.

Ein bisschen merkwürdig ist es, wenn man sich plötzlich auf der anderen Seite wiederfindet. Und der Branchendienst kress berichtet:

kress: FAZ will "Märkische Allgemeine" verkaufen

kress: FAZ will "Märkische Allgemeine" verkaufen

Immer Ärger mit dem Geld

Es ist schon irgendwie ungerecht. Da schränken die Brandenburger sich im bundesweiten Vergleich am stärksten ein und reduzieren ihren Konsum, aber auf dem Sparkonto sind sie verglichen etwa mit Hessen oder Hamburgern immer noch arm wie Kirchenmäuse. Das sagen zumindest Studien anlässlich des etwas in die Jahre gekommenen “Weltspartages” am kommenden Freitag.

Und wer als Kunde der Deutschen Bank gerade mal auf Geld wartet, das nicht auf dem Konto ankommt, obwohl der andere es überwiesen hat, der sollte mal die Bankverbindung prüfen. Denn seit 1. Oktober ist das Geldhaus etwas pingeliger, was die Korrektheit der Angaben angeht – sonst geht das Geld einfach ruckzuck wieder zurück zum Absender.

Hat Facebook Ärztemangel?

Gestern wollte die Brandenburger Gesundheitsministerin Anita Tack (Linke) “neue Chancen” für die medizinische Versorgung auf dem Land vorstellen. Aber irgendwie war das eher kalter Kaffee. Ein bisschen wenig von einer neuen Ministerin, habe ich dazu in der “Märkischen Allgemeinen” kommentiert.

Und dann habe ich mich in der heutigen Ausgabe noch mit meinem Kollegen Ralf Schuler über den Nutzen von Facebook & Co. duelliert. Dazu gibt es ein kurzes Pro & Contra, wobei sicher noch mehr zu sagen wäre.

Als Nachtrag noch: In der Mittwoch-Ausgabe der MAZ hatte ich noch einen kurzen Text zum Google-Verizon-Deal über ein mögliches “zweites Bezahl-Internet” geschrieben. Immer schwierig (und ein bisschen unbefriedigend) in der Print-Ausgabe, wo man ja für Leser schreibt, die womöglich schon nicht so genau wissen, was das Internet ist, so etwas komplexes wie Netzneutralität darzustellen.

Ein Award für die Wortwolken

Ich fühle mich dann mal ausgezeichnet. Beim elften “European Newspaper Award” gab es unter anderem einen Preis für die “Märkische Allgemeine” in der Kategorie “Visualisierung”, und zwar für meinen Beitrag “Wortwolken im Wahlkampf”, der die Landtagswahlprogramme als “tag cloud” dargestellt und analysiert hat. Und über den ich hier ja auch schon geblogt habe.

SPD

Mich freut das vor allem, weil meine Idee und meine Umsetzung eher ganz spontan waren und ich nicht wirklich gedacht hätte, dass so was innovatives seinen Weg in die MAZ finden würde. Und es gab ja auch Kollegen, die die Sinnhaftigkeit der Aktion anzweifelten und bemängelten, das hätte ja wohl überhaupt keine Aussage. So unterschiedlich können Bewertungen ausfallen.

Dass das Lob aus der Chefredaktion dann an den Layoutchef geht, der die Grafiken auf die Seite 3 gehoben hat, geschenkt. Ich freu’ mich trotzdem.

Update:
Hier findet sich der entsprechende Text in der “Märkischen Allgemeinen” dazu.