Neues Webarchiv-Projekt Zoetrope: Suchmaschine fürs Gestern

Ob verschwundene Online-Schnäppchen oder verschollene Einträge - eine neue Suchmaschine will nicht nur Seitenhinhalte von heute, sondern auch von gestern auffinbar machen.

Was wir heute im Web finden, kann morgen schon wieder verschwunden sein. Bild: dpa

Das Internet ist, trotz seiner gigantischen Datenbestände, ein sehr dynamisches Medium: Auf aktuellen Nachrichtenangeboten, in Finanzdiensten und auf Shoppingportalen ändern sich die Inhalte minütlich. Wer in die Vergangenheit blicken will, muss Suchmaschinen bemühen, doch die Darstellung von Veränderungen über einen bestimmten Zeitraum ist damit nur mühselig möglich.

Amerikanische Informatik-Wissenschaftler wollen das Problem nun lösen. Sie haben eine Software entwickelt, mit der man leicht bedienbar auf ein Archiv des Netzes zurückgreifen kann. Das Projekt wurde von Forschern der Universität Washington in Zusammenarbeit mit dem Software-Konzern Adobe umgesetzt und befindet sich derzeit im funktionsfähigen Prototypen-Stadium.

Zoetrope, benannt nach einem optischen Kinderspielzeug, das aufgrund der Trägheit des menschlichen Auges dem Betrachter bewegte Bilder vorgaukeln kann, soll ganz neue Einblicke ins Internet ermöglichen. Die Software bietet dazu einige interessante Funktionen, um mit dem Datenbestand umzugehen, die nicht nur wissenschaftliche Statistiker interessieren dürften. Die wichtigste Funktion nennt sich "Lupe": Mit dieser ist es möglich, bestimmte Bereiche einer Website zu markieren und deren Veränderung über eine Zeitleiste zu betrachten - ganz einfach mit Hilfe eines kleinen Reglers. So lassen sich etwa die Schlagzeilen großer Nachrichtenmedien über mehrere Tage stundengenau verfolgen oder betrachten, wie Preise bei einer Airline oder einem Online-Shop fluktuieren.

Noch spannender ist die Kombination mehrerer Faktoren: So kann man etwa die Entwicklung des Ölpreises mit dem der Kosten an der Tankstelle in Verbindung setzen und als drittes noch wichtige Nachrichtenereignisse kombinieren, die die preise beeinflussen. Dazu bedarf es nur weniger Mausklicks.

Zoetrope erkennt Zahlen und stellt sie auf Wunsch in Form eines übersichtlichen Graphen dar. Selbst beim morgendlichen Trip ins Büro profitiert man von dem Dienst: Die Forscher zeigten eine Beispielanwendung, bei der die Stauwahrscheinlichkeit anhand der Wetterlage und der Tageszeit betrachtet wurde. Dazu setzten sie einfach mehrere Lupen auf einer Verkehrsübersichtskarte und einem lokalen Wetterdienst und bewegten den Regler. Neben Web-Angeboten kann die Software auch mit anderen Dokumentenarten wie PDF-Dateien umgehen.

Aktuell steht der Datenbestand von Zoetrope allerdings ganz am Anfang. Die Wissenschaftler haben erst im Sommer 2008 damit begonnen, regelmäßige Schnappschüsse wichtiger Web-Angebote zu nehmen - 1000 verschiedene werden derzeit erfasst. Dabei ist die Software intelligent genug, Daten nur dann zu speichern, wenn sich ein Angebot wirklich verändert hat. Die Macher wollen künftig mit größeren Netz-Archivierungsprojekten wie dem riesigen "Internet Archive" zusammenarbeiten. Letzteres sammelt seine Daten seit 1996 und bietet auch einen Blick auf zahlreiche Inhalte, die heute nicht mehr im Web existieren.

Außerdem könnte Zoetrope als Zensurumgehungswerkzeug dienen: Wird beispielsweise ein Online-Angebot aus rechtlichen Gründen gesperrt, kann man mit dem Dienst zumindest auf die letzte verfügbare Version zurückgreifen. Unklar ist allerdings, ob solche archivierten Seiten nicht ebenfalls von richterlichen Verfügungen erfasst wären - in Deutschland kam es so bereits des öfteren zu Archivlöschungen und Google und Internet Archive sperren sich anwaltlichen Anordnungen ebenfalls nicht.

Dynamische Angebote wie das Online-Lexikon Wikipedia eignen sich besonders gut für die Beobachtung mit Zoetrope: So lassen sich die Veränderungen durch die Nutzer über einen Zeitraum leicht beobachten, was derzeit nur mit viel Klickarbeit möglich ist. Eytan Adar, Leiter des Projekts, will mit dem Werkzeug das Web weniger vergänglich machen: "Der Browser bietet ein Fenster ins Internet im Jetzt-Zustand. Wer etwas sucht, bekommt immer nur die Resultate des heutigen Tages."

Noch ist unklar, wann Zoetrope für die allgemeine Öffentlichkeit zugänglich sein wird. Derzeit rechnen Adar und sein Team von der Universität Washington mit einer Bereitstellung im Sommer nächsten Jahres, dann sollte auch der Datenbestand deutlich vergrößert worden sein. Vermutlich wird das Werkzeug als Browser-Plug-in für Firefox und andere gängige Programme angeboten. Die Forscher hoffen, es kostenlos oder zumindest werbefinanziert anbieten zu können.

Einmal zahlen
.

Fehler auf taz.de entdeckt?

Wir freuen uns über eine Mail an fehlerhinweis@taz.de!

Inhaltliches Feedback?

Gerne als Leser*innenkommentar unter dem Text auf taz.de oder über das Kontaktformular.

Bitte registrieren Sie sich und halten Sie sich an unsere Netiquette.

Haben Sie Probleme beim Kommentieren oder Registrieren?

Dann mailen Sie uns bitte an kommune@taz.de.