Neues Webarchiv-Projekt Zoetrope: Suchmaschine fürs Gestern
Ob verschwundene Online-Schnäppchen oder verschollene Einträge - eine neue Suchmaschine will nicht nur Seitenhinhalte von heute, sondern auch von gestern auffinbar machen.
Das Internet ist, trotz seiner gigantischen Datenbestände, ein sehr dynamisches Medium: Auf aktuellen Nachrichtenangeboten, in Finanzdiensten und auf Shoppingportalen ändern sich die Inhalte minütlich. Wer in die Vergangenheit blicken will, muss Suchmaschinen bemühen, doch die Darstellung von Veränderungen über einen bestimmten Zeitraum ist damit nur mühselig möglich.
Amerikanische Informatik-Wissenschaftler wollen das Problem nun lösen. Sie haben eine Software entwickelt, mit der man leicht bedienbar auf ein Archiv des Netzes zurückgreifen kann. Das Projekt wurde von Forschern der Universität Washington in Zusammenarbeit mit dem Software-Konzern Adobe umgesetzt und befindet sich derzeit im funktionsfähigen Prototypen-Stadium.
Zoetrope, benannt nach einem optischen Kinderspielzeug, das aufgrund der Trägheit des menschlichen Auges dem Betrachter bewegte Bilder vorgaukeln kann, soll ganz neue Einblicke ins Internet ermöglichen. Die Software bietet dazu einige interessante Funktionen, um mit dem Datenbestand umzugehen, die nicht nur wissenschaftliche Statistiker interessieren dürften. Die wichtigste Funktion nennt sich "Lupe": Mit dieser ist es möglich, bestimmte Bereiche einer Website zu markieren und deren Veränderung über eine Zeitleiste zu betrachten - ganz einfach mit Hilfe eines kleinen Reglers. So lassen sich etwa die Schlagzeilen großer Nachrichtenmedien über mehrere Tage stundengenau verfolgen oder betrachten, wie Preise bei einer Airline oder einem Online-Shop fluktuieren.
Noch spannender ist die Kombination mehrerer Faktoren: So kann man etwa die Entwicklung des Ölpreises mit dem der Kosten an der Tankstelle in Verbindung setzen und als drittes noch wichtige Nachrichtenereignisse kombinieren, die die preise beeinflussen. Dazu bedarf es nur weniger Mausklicks.
Zoetrope erkennt Zahlen und stellt sie auf Wunsch in Form eines übersichtlichen Graphen dar. Selbst beim morgendlichen Trip ins Büro profitiert man von dem Dienst: Die Forscher zeigten eine Beispielanwendung, bei der die Stauwahrscheinlichkeit anhand der Wetterlage und der Tageszeit betrachtet wurde. Dazu setzten sie einfach mehrere Lupen auf einer Verkehrsübersichtskarte und einem lokalen Wetterdienst und bewegten den Regler. Neben Web-Angeboten kann die Software auch mit anderen Dokumentenarten wie PDF-Dateien umgehen.
Aktuell steht der Datenbestand von Zoetrope allerdings ganz am Anfang. Die Wissenschaftler haben erst im Sommer 2008 damit begonnen, regelmäßige Schnappschüsse wichtiger Web-Angebote zu nehmen - 1000 verschiedene werden derzeit erfasst. Dabei ist die Software intelligent genug, Daten nur dann zu speichern, wenn sich ein Angebot wirklich verändert hat. Die Macher wollen künftig mit größeren Netz-Archivierungsprojekten wie dem riesigen "Internet Archive" zusammenarbeiten. Letzteres sammelt seine Daten seit 1996 und bietet auch einen Blick auf zahlreiche Inhalte, die heute nicht mehr im Web existieren.
Außerdem könnte Zoetrope als Zensurumgehungswerkzeug dienen: Wird beispielsweise ein Online-Angebot aus rechtlichen Gründen gesperrt, kann man mit dem Dienst zumindest auf die letzte verfügbare Version zurückgreifen. Unklar ist allerdings, ob solche archivierten Seiten nicht ebenfalls von richterlichen Verfügungen erfasst wären - in Deutschland kam es so bereits des öfteren zu Archivlöschungen und Google und Internet Archive sperren sich anwaltlichen Anordnungen ebenfalls nicht.
Dynamische Angebote wie das Online-Lexikon Wikipedia eignen sich besonders gut für die Beobachtung mit Zoetrope: So lassen sich die Veränderungen durch die Nutzer über einen Zeitraum leicht beobachten, was derzeit nur mit viel Klickarbeit möglich ist. Eytan Adar, Leiter des Projekts, will mit dem Werkzeug das Web weniger vergänglich machen: "Der Browser bietet ein Fenster ins Internet im Jetzt-Zustand. Wer etwas sucht, bekommt immer nur die Resultate des heutigen Tages."
Noch ist unklar, wann Zoetrope für die allgemeine Öffentlichkeit zugänglich sein wird. Derzeit rechnen Adar und sein Team von der Universität Washington mit einer Bereitstellung im Sommer nächsten Jahres, dann sollte auch der Datenbestand deutlich vergrößert worden sein. Vermutlich wird das Werkzeug als Browser-Plug-in für Firefox und andere gängige Programme angeboten. Die Forscher hoffen, es kostenlos oder zumindest werbefinanziert anbieten zu können.
taz lesen kann jede:r
Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen
Starten Sie jetzt eine spannende Diskussion!