====================
== Andreas Streim ==
====================
I am a digital resident and this is my ~

Elfeinhalb Jahre, ein Bild

Archiv Artikel MAZ Statistik

Seit 1999 arbeite ich - mit einer kurzen Unterbrechung - bei der “Märkischen Allgemeinen” (MAZ) in Potsdam. Die vergangenen Jahre lag bei mir immer ein riesiger Zeitungsstapel in der Wohnung. In den Ausgaben waren Artikel von mir, die ich unbedingt noch ausschneiden musste, um sie dann wieder auf Papier zu kleben und in Ordner abzuheften. Um das aufzubewahren, was man tagein, tagaus an doch sehr vergänglichem Tageszeitungsjournalismus schafft.

Gestern habe ich den großen Papierstapel weggeworfen.

Seit Sommer 2001 hat die MAZ nämlich ein elektronisches Archiv - und ich habe mir jetzt alle meine Artikel auf meine Festplatte heruntergeladen. (Das ist nicht ganz so einfach wie es klingt, weil mein Autorenkürzel “ast” als “Ast” in vielen Texten vorkommt, die mit mir nichts zu tun haben. Aber mit ein bisschen Logik, sogenannten regulären Ausdrücken, und der Programmiersprache Python kein unüberwindbares Hindernis. Ein wirklich guter Grund, warum Journalisten programmieren können sollten.)

Und wenn man dann seine ganzen Texte digital vor sich liegen hat, dann kann man plötzlich Fragen beantworten, die einen Journalisten immer umtreiben:

Was schreib ich denn eigentlich so?

Oder in diesem Fall: Was schreibe ich denn eigentlich am meisten?

Dazu habe ich alle meine Texte in einen großen Text gekippt (bzw. ein dafür geschriebenes Programm hat das gemacht) und diesen dann bei Wordle in eine Wortwolke umwandeln lassen.

Die am häufigsten benutzten Worten mit Ausnahme von Standard-Wörtern der deutschen Sprache wie “und”, “auf”, “im” etc. pp. werden dabei in einer Grafik dargestellt. Je größer das Wort, desto häufiger ist es im Vergleich zu den anderen benutzt worden. Und so sieht die Wortwolke meiner MAZ-Artikel von Sommer 2001 bis heute aus:

Für einen Wirtschaftsredakteur ist das Wort “Prozent” (dicht gefolgt von Euro) als am häufigsten benutztes vielleicht nicht so ungewöhnlich, ich hätte aber vorher nicht darauf getippt.

Mal sehen, was sich mit dem digitalen Datenschatz an Artikeln sonst noch so anstellen lässt, in den nächsten Tagen und Wochen.

[Update 23.30 Uhr: Durch eine technische Panne (naja, einen Fehler im Programm) wurden beim ersten Wordle nur etwa drei Viertel der Artikel berücksichtigt. Jetzt sind es alle.]

[Update 6.4.2012: So, nochmal die Datenbasis überarbeitet und das Wordle neu erzeugt.]

Previous Post Next Post