piwik no script img

Wer sucht, der findet auch in deutscher Sprache

■ Internetverzeichnisse wollen Ordnung in das Informationschaos bringen. Finanziert werden sie von der Werbeindustrie

Als der Abt Hugues de Saint- Cher 1240 das erste Stichwortverzeichnis der Bibel aufstellen lies, waren mit dieser Aufgabe 500 Mönche beschäftigt. Dabei hat die Bibel in der heute üblichen Druckfassung nur etwa 800 Seiten. Das sind kaum mehr als fünf Megabyte. Das World Wide Web, so wird geschätzt, enthält zur Zeit etwa 50 Millionen Seiten oder 400 Gigabyte, und es wächst monatlich um ungefähr 20 Prozent. Damit wären sämtliche Mönche der Welt überfordert. Aber ihre Handarbeit wird heute von den sogenannten Suchmaschinen übernommen. Sie filzen den Datenbestand und erschließen ihn mit Algorithmen, die Geschäftsgeheimnisse der jeweiligen Betreiberfirmen sind.

Einige dieser Programme sind bereits Klassiker geworden, allen voran „Yahoo!“, das letzte Woche auch mit einer deutschen Version ans Netz ging: www.yahoo.de. Yahoo! entstand aus einem Hobby der beiden Stanford-Studenten David Filo und Jerry Yang; die hatten im April 1994 ihre Bookmark- Liste von WWW-Adressen ins Netz gestellt. Der Zuspruch war so groß, daß die beiden ein Jahr später ihr Studium abbrachen, um sich ganz Yahoo! zu widmen.

Inzwischen werden die Aktien von Yahoo! an der Börse gehandelt, und das Unternehmen diversifiziert munter in den verschiedensten Geschäftsfeldern. Es gibt regionale Angebote für New York und die kalifornische Bay Area, außer Kanada, Japan, Großbritannien und jetzt Deutschland sollen in nächster Zeit nationale Versionen für Frankreich, die Beneluxstaaten und Skandinavien hinzukommen. Soeben ist mit „Yahooligans“ ein spezielles Angebot für Kinder und Verzeichnis von E- Mail-Adressen on line gegangen, „My Yahoo!“ heißt ferner das Agentenprogramm, das für seine Benutzer maßgeschneiderte Informationen zusammensucht.

In der realen Welt gibt Yahoo! im Computer-Verlag Ziff-Davis eine eigene Zeitschrift heraus. Ziff-Davis hält auch eine Minderheitsbeiteiligung am deutschen Yahoo!. Doch echten Profit hat selbst das amerikanische Yahoo! noch nicht erarbeitet. Erst für dieses Jahr ist der break-even angepeilt, die deutsche Version will Ende des nächsten Jahres Gewinn erzielen.

Die erste deutsche Suchmaschine ist Yahoo.de nicht, auch wenn sie gute Chancen hat, die beliebteste zu werden. Deutsche Netzwerker sind schon länger mit verschiedenen Angeboten ins Internet gegangen. Das reicht von Viermannfirmen wie „Sharelook“, die, vom Arbeitsamt unterstützt, im Ruhrgebiet ihren Schwerpunkt aufbauen (www.sharelook.de), bis zum Burda-Verlag, der in seinen „Netguide“ (netguide.de) mehrere Millionen investiert hat. Weitere deutsche Suchmaschinen, die das „Verzeichnis aller Internetverzeichnisse“ edirectory (www .edirectory.com) auflistet, sind Web.de (vroom.web.de), Dino (www.dino-online.de), Aladin (www.aladin.de), Kolibri (www .kolibri.de), Crawler (www .crawler.de) und Flipper (flp.cs.tuberlin.de/flipper). Eine angeblich deutsche Version von Lycos (www.lycos.de) kommt in Wirklichkeit aus den USA und ist entsprechend lahm.

Die Leistung einer Suchmaschine hängt zum einen von der Größe ihrer Datenbasis ab, zum anderen von der internen Organisation der Suche. In München sitzen bei Yahoo.de vier Freiberufler und durchsuchen das deutschsprachige Internet nach interessanten Sites, die sie dann in den Index von Yahoo! einordnen. Wem die deutschen Auswahl nicht genügt, kann mit einen Link zum amerikanischen Yahoo! oder zur Suchmaschine „Alta Vista“ weitermachen. „Wir haben festgestellt, daß unsere User etwa zur Hälfte in unserem Index und zur Hälfte mit dem Stichwort suchen“, sagt Karsten Weide, Sprecher von Yahoo.de.

Weil Yahoo! nur die Adressen mit einer knappen Inhaltsangabe auflistet, genügen fünf große IBM- Pentium-Rechner als Server für das Verzeichnis. Wer mit ihnen sucht, der findet. Vielleicht. Denn die „Internet-Bibliothekare“, die an diesen WWW-Indexen arbeiten, stehen vor der kniffligsten Aufgabe, die die Informationswissenschaft heute kennt. Schon 1945 wurde ein System einer universal venetzten Bibliothek entworfen. Doch damals war noch nicht abzusehen, daß zum Weltwissen bald auch Live-Videoaufnahmen von Kaffeemaschinen oder „Bianca's Smutshack“ gehören würden.

Um in dieses Chaos Ordnung zu bringen, gibt es zwei Methoden: Die erste ist die der Indexierung, bekannt aus den Schlagwortregistern von Universitätsbibliotheken. Nach diesem Vorbild funktioniert zum Beispiel Yahoo.de. Auch Dino, das von Siemens Nixdorf Internet Services betrieben wird, Sharelook und Web.de sind Indexverzeichnisse, die ihr System meist recht umstandslos bei Yahoo! abgekupfert haben. Bei Kolibri gibt es auch noch sogenannte „Assistenten“, die das Suchen erleichtern sollen: Wenn man entsprechende Angaben macht, liefert Kolibri zum Beispiel nur Seiten, die in diesem Monat dazugekommen sind.

Die „Ontologie“, wie das Kategoriensystem bei Yahoo! durchaus zutreffend heißt, muß man freilich erst einmal verstehen. Zur Zeit bietet Yahoo.de 14 (wie das amerikanische Original) Oberbegriffe an (von „Bildung und Ausbildung“ bis „Unterhaltung“), die sich in zahllose Unterkategorien aufspalten. Die Ordnung dieser Suchbäume ist einigermaßen willkürlich und führt unweigerlich zu der bekannten Ratlosigkeit vor dem Katalog in der Stadtbibliothek. Steht ein Buch über Pasolini nun unter „Italienische Literatur“, „Film“ oder „Biographien“?

Wer im Internet auf Anhieb eine große Menge Pasolini-Quellen finden will, ist mit einer Volltextsuchmaschine wie etwa dem Webcrawler oder Infoseek zunächst besser bedient. Diese „Findmaschinen“ durchsuchen automatisch das Internet – wie eine Spinne, die sich in ihrem Netz bewegt. Nicht umsonst hat Crawler daher eine dicke Königsspinne auf seiner Leitseite, die sich mit den Worten „Ich tauche kurz für Sie ins Netz“ an die Arbeit macht. Tatsächlich durchkämmt sie nur die Datenbasis, die aus den automatischen Fischzügen des Roboters aufgebaut worden ist. Der Nachteil dieses Verfahrens ist die fehlende Wertung des gefundenen Materials: Volltextsucher liefern wahllos Tausende von Internetadressen zurück. Unter dem Stichwort „Pasolini“ wird zwar auch die offizielle Pasolini-Fanclub-Site angezeigt, aber ebenso vollkommen unbrauchbare Adressen – etwa die Homepage eines italienischen Restaurants, dessen Besitzer „Pasolini“ heißt.

Auch Burdas Netguide ist eine solche Suchspinne. Ihre Datenbasis wird einmal pro Woche auf Magnetband vom Partnerunternehmen Lycos aus den USA angeliefert. Der deutsche Netguide filtert aus den Adressen, die Lycos (so heißt auch eine Spinnenart) gefunden hat, diejenigen heraus, deren Domain-Namen auf „.de“ („Deutschland“) enden. Die Redaktion von Focus-Online, der Netzversion des Burda-Blattes, fügt dann ausgewählte Adressen hinzu, die ihr besonders nützlich erscheinen.

Finanziert werden alle Suchmaschinen durch Werbung. Hier bekommt die Industrie ihre Zielgruppen genau vor die Flinte geliefert: Wer im Verzeichnis zum Beispiel nach Reiseangeboten sucht, dem kann man auch gleich die Werbung eines Reisebüros mitliefern. Für das deutsche Yahoo! sind die acht „Banner“, wie die Werbeplätze heißen, schon verkauft, unter anderem an Neckermann, die Commerzbank, Toshiba und IBM.

Ein Banner kostet fur einen Monat auf wechselnden Seiten bis zum Jahresende 15.000 Mark. Später will man nach „garantierten Kontakten“ abrechnen. „Das Interesse von Anzeigenkunden ist sehr groß. Wir müssen im Augenblick sogar Interessenten abweisen“, sagt Karsten Weide, Sprecher von Yahoo.de. Anzeigenleiter Raoul Hagen nahm bloß Werbung an, die einen per Hotlink zu einer Homepage bringt, „wo was los ist“: Interaktion, ein Preisauschreiben, eine Java-Animation.

Während Netguide und Yahoo! von der Anzeigenabteilung großer Verlage profitieren, werden die meisten kleinen Suchmaschinen mit Werbung von der Telekom- Tochter 1&1 beliefert, die dafür eine eigene Abteilung „Electronic Marketing“ gegründet hat. Die besser finanzierten amerikanischen Lizenzausgaben könnten trotzdem zur Gefahr für die einheimischen deutschen Suchmaschinen werden. Denn Kolibri und Sharelook werden nur zu Marketingzwecken von Internet-Providern oder von anderen Kleinunternehmern betrieben. Daß die großen Anbieter ihm das Wasser abgraben könnten, befürchtet Jörg Roder von Kolibri aber dennoch nicht: „Eine Suchmaschine ist wie eine Stammkneipe. Wer unsere Adresse erst mal in seinen Bookmarks hat, der kommt auch immer wieder zu uns zurück.“ Tilman Baumgärtel

100131.2223@compuserve.com

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen