Tumblelog by Soup.io
Newer posts are loading.
You are at the newest post.
Click here to check if anything new just came in.
finkregh

Ab sofort steht unter http://depub.org/tagesschau/ das vor kurzem "geleakte" Archiv von tagesschau.de als Online-Version zur Verfügung. Enthalten sind rund 200.000 Meldungen aus den letzten 10 Jahren tagesschau.de.

Durch die Veröffentlichung versuchen wir die Artikel vor dem Verschwinden aus dem Netz zu bewahren. Weitere Informationen, warum die Artikel von tagesschau.de gelöscht werden mussten finden sich hier und hier.

Im geleakten Archiv befanden sich rund 270.000 Dateien. Einige enthielten allerdings nur Verweise auf Klickstecken oder Videos. Wir haben versucht diese Artikel auszufiltern aber dennoch sind noch einige Artikel ohne Inhalt vorhanden. Außerdem bestehen ältere Meldungen häufig nur aus einem Satz. Leider waren im Archiv auch keine Bilder enthalten, so dass diese derzeit noch nicht mit angeboten werden können. Die Inhalte der Mediathek waren natürlich auch nicht im Archiv.

Das Archiv wird von nun an regelmäßig und halbwegs automatisch aktualisiert und für neue Artikel werden auch die Bilder mit eingebunden. In den nächsten Tagen werden außerdem noch folgende Funktionen hinzukommen:

  • Offline-Version und Datenbankdump zum herunterladen
  • Suchfunktion (wahrscheinlich über Google, Indizierung läuft)
  • Durchsuchen nach Tags, Kategorien und Themen
  • Statistiken
  • Permanent-Link (Weiterleitung zu tagesschau.de falls Artikel noch nicht depubliziert wurde, sonst ins Archiv)
  • Verknüpfung mit anderen Daten (Geodaten, Warlogs [falls sinnvoll], etc.)
Depubliziertes
Reposted bydatenwolftantelit

Don't be the product, buy the product!

Schweinderl