Suchmaschine war gestern: Das Internet als Antwortmaschine

391257 5182526

Suchmaschine war gestern: Das Internet als Antwortmaschine

Antworten bekommen statt suchen: Computerlinguisten wollen aus dem Internet eine allwissende, sprechende Antwortmaschine machen. Aber sagt die auch immer die Wahrheit?

7.5.2008 2:00 Uhr

Heute fragen wir Suchmaschinen - morgen könnte das Web uns zurückfragen. Bild: dpa

Von Martin Kaul

Schnöddrige Suchwörter eingeben bei Google? Mühsam durch Millionen von Suchtreffern klicken? Nächtelang Reiserouten erstellen auf der virtuellen Landkarte im Web? Was vor wenigen Jahren noch als Wissensrevolution im Internet galt, ist längst Schnee von gestern. Internetforscher basteln derzeit an der Wissenslandschaft von morgen: Das Internet soll sprechen lernen. Und wenn es spricht, dann denkt es auch.

Statt sich auf der Suche nach Informationen die Finger wund zu tippen, könnte in Zukunft die Lautsprecherbox das Sprachrohr der weltweiten Wissensvorräte im Internet sein - oder das Handy: Das sprechende Netz soll bald eine passgenaue Antwort auf jede konkrete Frage anbieten. So zumindest sehen es WissenschaftlerInnen am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken vor sich. Statt einer Suchmaschine entwickeln sie derzeit in einem millionenschweren Projekt die Antwortmaschine der Zukunft.

Die Erfindung könnte der Tod aller Wissensquiz-Sendungen sein: Denn die Antwortmaschine soll nicht nur alles wissen, sondern es auch überall ausplaudern. Die Vision: Die NutzerInnen sprechen ihre Frage einfach ins eigene Handy - etwa, um das gebrauchte Auto zu verkaufen: "Wie viel ist mein alter Wagen noch wert?" Das Telefon übermittelt die Frage ins Internet - und dort kommt die Antwortmaschine in Gang. Die fragt zurück: nach Modell, Baujahr und allem was sie wissen muss. Schlaue Webseiten verstehen die Aufgabe - und suchen dann nach der passenden Antwort. So findet der hochpräzise Suchagent die nötigen Infos im Internet zusammen - und spuckt die richtige Antwort aus. Inseriert werden kann genauso. Und wenn ein Käufer gefunden ist, übernimmt das Handy per sprachliche Anweisung auch die Abmeldung bei der Behörde. Von diesem Szenario träumen die Informatiker aus dem Saarland.

Auf Computerdeutsch heißt deren Zukunfts-Technologie: semantisches Web. Computerlinguist Wolfgang Wahlster, Geschäftsführer am DFKI, und sein Team arbeiten derzeit im Akkord daran, die Webseiten von heute mit ihrer eigenen Sprache auszustatten: "Die Sprache des Web bekommt eine dritte Dimension. In Zukunft werden zusätzlich zu Layout und Struktur von Homepages auch deren Inhalte so beschrieben, dass der Computer diese versteht." Das heißt: Das Netz versteht sich selbst.

Heute basiert die Internetsuche noch auf einfachen Zeichenvergleichen. Wer eine Suchanfrage im Netz eingibt, sucht nach einer Kopie dieser Zeichenkette. Wort-, aber auch Bild-Suchmaschinen funktionieren so: Sie scannen das Internet nach einer Zeichenkette durch, die mit der vorgegebenen übereinstimmt, dann listen sie blind alle Ergebnisse auf, bei denen eine Übereinstimmung zutrifft. Spätestens hier müssen die Nutzer aber selbst weitersuchen.

Mit dem semantischen Web soll das Internet selbst Teil der Suche werden können: Kontextsensibilität heißt das neue Schlagwort. Weil die Antwortmaschine nicht einfach die Zeichenkette kopiert, sondern das Wort selbst versteht, kann es alle Suchanfragen ignorieren, die mit der Suche nichts zu tun haben. Mit einer programmierten Grammatik kann es so nicht nur Wörter, sondern beliebige Sätze verstehen, entschlüsseln und beantworten. Je spezieller die Frage, desto konkreter die Antwort.

Darüber hinaus versprechen die EntwicklerInnen ein System, das mitdenkt. Die Antworten aus dem Internet werden dem entsprechenden Kontext und Hintergrund der einzelnen BenutzerIn angepasst: Die Antwortmaschine weiß, wo die einzelnen NutzerInnen sind - und merkt sich, was sie zuvor gefragt haben. "Die Systemleistung besteht nicht mehr darin, den Benutzer in seinem Suchprozess zu unterstützen, sondern ihm eine gezielte Antwort auf seine konkrete Frage zu geben", sagt Intelligenzforscher Wolfgang Wahlster.

Dahinter versteckt sich ein zweischneidiger Traum: In Zukunft sollen nicht nur Menschen die im Internet verbreiteten Informationen abrufen und benutzen können, sondern das Internet soll selbst zu denken beginnen - und die unendlichen Datenströme erfassen und interpretieren lernen.

Hintergrund für die Neugier sind die rasant steigenden Datenmengen im Netz. Das Wissen der Zukunft, das hat selbst der Brockhaus-Verlag gelernt und seine Angebote ins Netz verlagert, steht im Internet. Doch für den explodierenden Wissensbestand im Netz braucht es neue Ordnungsgrundlagen. Denn die digitale Datenmenge in der virtuellen Welt ist längst so undurchdringbar wie das Universum: Die Daten, die heute im Internet abrufbar sind, machen etwa den dreimillionenfachen Umfang aller bisher geschriebenen Bücher aus. "Allein in den nächsten zwei Jahren", so sagt die Forscherin Jasmin Franz, Dozentin an der Wiener Semantic Web School, "werden voraussichtlich mehr Daten generiert als in der gesamten bisherigen Geschichte. Die Datenmenge, die wir für 2010 erwarten, gleicht einem Bücherstapel, der von der Erde bis zum Planeten Pluto reicht." Deshalb, so meint Franz, muss eine neue Ordnung her: "Suchen ist nur ein Ausdruck mangelnder Organisation. Wonach wir uns sehnen, ist nicht Suchen, sondern Finden. Doch die Suchwerkzeuge, die heute im unstrukturierten Datenlabyrinth einsetzen, muten geradezu steinzeitlich an."

Im Testbetrieb funktioniert die neue Antwortmaschine schon problemlos. Doch um einen universellen Betrieb zu gewährleisten, muss das gesamte Web in die neue Dimension vorstoßen - und mit maschinenverstehbaren semantischen Beschreibungen versehen werden. "Bislang liegt die Zahl der semantischen Webdokumente und Webdienste noch im einstelligen Prozentbereich", sagt Wahlster. "Aber das Internet hat sich in den letzten Jahren vor allem durch die Beteiligung der NutzerInnen ausgezeichnet. Wenn die Nutzer erkennen, welche Kraft im semantischen Web liegt, könnte das sehr schnell gehen - weil alle ihre Homepages semantisch programmieren." Er hofft darauf, dass seine Antwortagenten 2015 bereits bei vielen Menschen zum Alltag gehören.

Neben dem verheißungsvollen Turbo-Zugriff auf Wissenswertes hat die neue Wissenstechnologie auch ihre Schattenseiten: Schon heute schimpfen viele NutzerInnen über die Monopolisierung des Wissens im Netz. Was, wenn es statt tausender Suchergebnisse nur noch eine Antwort gibt? Wer gibt eigentlich die Antworten, die die Maschine ausspuckt? Und wer kann sie beeinflussen?

Um verlässliche Quellen auszumachen, verspricht Wolfgang Wahlster komplizierte Rechenschlüssel. Doch gleichzeitig warnt selbst er vor seiner neuen Maschine: "Das ist eine Antwortmaschine, keine Wahrheitsmaschine. Und blindes Vertrauen ist im Internet nie angebracht. Wer aber Zweifel hat, der kann die Antwortmaschine natürlich zurückfragen, woher die Infos kommen."

Kritiker sehen das skeptischer - und befürchten, dass die Vereinfachung des Suchprozesses auch zu einer Vereinheitlichung der Angebote führen kann: Denn im Kampf um das Wissen im Netz zeigt sich schon jetzt, welche Wirkung die Suchmaschinen durch zensierte Inhalte und gesperrte Infos entfalten können. Debora Weber-Wulff, Sprecherin der Fachgruppe Informatik und Ethik in der Gesellschaft für Informatik, hat sich selbst mit der Didaktik des Suchens beschäftigt - von der neuen Generation von Antwortmaschinen hält sie nichts: "Die Frage ist doch nicht, was eine solche Antwortmaschine sagt, sondern was sie nicht sagt. Es gibt viele Fragen, auf die es gar keine eindeutigen Antworten gibt. Auf manche Fragen gibt es sogar gar keine Antworten. Wenn der Mensch seine Fragen nicht beantworten kann, wie soll es dann eine Maschine können?"

Neben ihren Zweifeln am Sinn der Erfindung hält Weber-Wulff gerade die kontextsensible Qualität der Antwortmaschinen für gefährlich: "Eine kontextsensitive Maschine, die sich erinnern kann, ist immer höchst problematisch. Wie sollen wir wissen, was mit diesem Wissen über uns noch geschehen kann und wer darauf zugreift?"

Die Ethik-Expertin im Netzbetrieb warnt daher vor zu schnellen Antworten - und gibt ihren Gebrauchtwagen lieber beim Händler ab: "Man will doch nicht, dass so ein System plötzlich zurückfragt, woher man eigentlich das Geld für ein neues Auto hat, obwohl man doch laut Steuererklärung pleite ist."

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 50.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen