A new hope
So mein erster Blogpost. Ever. Und zwar zu einem neuen Projekt, dass ich begonnen habe. Dabei stützt sich dieses Projekt wesentlich auf den sehr zu empfehlenden Talk von David Kriesel am 33c3. Kriesel hat dabei knapp 100’000 Artikel von Spiegel online “gevoratsdatenspeichert“ und damit sehr interessante Auswertungen erstellt. Dabei hat aber auch durchaus steile/amüsante Thesen wie etwa “wer mit wem was hat“ oder welche Redakteure besonders faul sind (Ressort Kultur). Falls euch der Vortrag gefällt lohnt es sich ebenfalls, den Blog von Kriesel zu lesen.
Das Ziel meines Projekts ist es, auf den Erkenntnissen von Kriesel aufbauend eine ähnliche Auswertung für ein Schweizer Medienunternehmen durchzuführen. Die von Kriesel angesprochene Kommentierbarkeit von Artikeln empfand ich als sehr spannend und möchte gerne diesen Teil ausbauen. Ich bin gespannt, was dabei rauskommt und werde meinen Lernprozess anhand dieses Blogs dokumentieren. Ebenfalls ist der zeitliche Aspekt interessant für mich, deshalb werde ich ebenfalls die gesamten Artikel als html speichern.
To do List
Crawler erstellen
So gut wie erledigt. Eine Knacknuss (folgt in einem späteren Blog)Crawl laufen lassen
Unterbrechungen möglichst frühzeitig erkennen (lesson learned von Kriesel)Daten auswerten
Tools zur Datenauswertung beschaffenLet the fun begin
Falls Ihr Ideen habt, nach was ich die Daten auswerten könnte, lasst es mich wissen. Ich bin gespannt auf eure Ideen und Inputs. Ich freue mich sehr auf dieses Projekt und hoffe euch während dieser Zeit regelmässig Updates liefern und am Schluss eine interessante Auswertung machen zu können.