piwik no script img

Gründlichere Konkurrenz für GoogleSuchmaschinen fehlt der Tiefgang

Was große Suchmaschinen nicht finden, wird im Netz kaum wahrgenommen. Junge Firmen versuchen, das "Deep Web" verfügbar zu machen, das Google und Yahoo ignorieren.

Kratzt nur an der Oberfläche - aber den meisten Usern genügt's: Suche per Google. Bild: dpa

Die meisten Nutzer erleben das Internet über Suchmaschinen: Sie geben Begriffe ein, erhalten eine Ergebnisliste und surfen los. Dass die Sicht auf das Web, die die großen Online-Anbieter liefern, nur ein kleiner Teil dessen ist, was das Netz zu bieten hat, wird dabei ignoriert. Das soll sich nun ändern: Agile Neugründungen versuchen, das so genannte Deep Web, das tiefe Netz, zu erfassen.

Bislang kommt jedoch niemand an die Marktmacht der großen Drei, Yahoo, Microsoft und insbesondere Google, heran. Das Start-up Cuil, das letztes Jahr mit viel Tamtam und neuer Technik online ging, kämpfte gleich zu Anfang mit schweren technischen Problemen und merkwürdigen Suchergebnissen - obwohl man behauptete, eine größere Datenbreite als alle anderen zu besitzen. Bedarf nach mehr Suchmaschinen-Vielfalt wäre längst da, so die Macher.

Anand Rajaraman, Mitbegründer des kleinen Google-Konkurrenten Kosmix, glaubt, dass das Web, das durch Suchmaschinen-Software, die so genannten Crawler, erfassbar sei, "nur die Spitze des Eisbergs" ist. "Die meisten Suchmaschinen versuchen, eine Nadel im Heuhaufen zu finden. Wir versuchen dagegen, den Heuhaufen erfahrbar zu machen", sagte er der New York Times.

Die inzwischen drei Billionen Adressen, die Google kennt und durchsuchen kann, reichen da nicht aus. Nur teilweise oder gar nicht verfügbar sind spezielle Datenbanken, die inzwischen an das Internet angeschlossen sind, den großen Suchmaschinen aber nur beschränkte Schnittstellen bieten.

Mit Finanzdaten kommen Yahoo, Google und Microsoft beispielsweise kaum klar - kein Wunder, dass die US-Börsenaufsicht SEC derzeit an einem eigenen Standard bastelt, mit dem Quartalsberichte und anderes veröffentlichungspflichtige Material endlich im Netz sichtbarer werden soll. Das geht weit über die einfache Erfassung von Suchbegriffen hinaus. Spezialsuchmsachinen wie das US-Forschungsvorhaben "DeepPeep" der University of Utah wurden speziell dafür entworfen, sich Datenbanken vorzunehmen. Die Software soll intelligent genug sein, ihre Struktur zu erfassen, ohne ein ganzes Lexikon an Suchbegriffen ausprobieren zu müssen.

In Europa versucht man sich ebenfalls an Forschungsprojekten zum Deep Web - und will mit neuen Suchmethoden Google schlagen. Weit gekommen ist man dabei allerdings bislang noch nicht. So scheiterte das mit hohen Staatsmitteln finanzierte deutsch-französische Projekt "Quaero" zunächst an Fragen der Ausrichtung: Die Franzosen wollen gerne ein echtes Produkt aufbauen wollten, die Deutschen interessieren sich stark für Grundlagenforschung.

Inzwischen wurden aus einem Großvorhaben zwei: Während man in Frankreich weiter an einer Google-Alternative bastelt, widmet sich das vom Bundeswirtschaftsministerium geförderte "Quaero"-Nachfolgeprojekt "Theseus" dem so genannten Internet der Dienste. Dabei geht es nur noch zum Teil um den Suchbereich; mit Hilfe semantischer Technologien werden aber zumindest unter anderem Bibliotheksbestände verfügbar gemacht. Bislang existieren jedoch nur Prototypen.

Von den kommerziellen Anbietern hört man hingegen eher wenig. Fireball, einst Ende der Neunzigerjahre hier zu Lande viel benutzt, gehört inzwischen zu Lycos Europe, das derzeit abgewickelt wird - Zukunft ungewiss. Angebote wie Abacho, Web.de oder Suchen.de konzentrieren sich auf Nischen wie lokale Suche, E-Mail-Dienste oder das Portalgeschäft. Möglicherweise interessant könnten nach wie vor so genannte Metasuchmaschinen sein, die die Ergebnisse zahlreicher Anbieter miteinander verknüpfen, um fehlende Treffer zu ergänzen und so ein tieferes Bild als Google & Co. zu liefern.

An der Leibniz-Universität Hannover wird mit "MetaGer" seit Jahren ein solches Projekt betrieben, dessen Technologie vom zum "Quaero"-Projekt gehörenden Pariser Unternehmen Exalead stammt. Wer damit sucht, erhält gleich auch noch Ergebnisse aus wichtigen wissenschaftlichen Datenbanken, die andere Anbieter ignorieren. Die Bedienung ist allerdings komplizierter als bei Google, weil die Einstellungsmöglichkeiten breiter sind. Dafür wird man aber auch mit oft interessanteren Ergebnissen belohnt. Das Problem: Vielen Nutzern reicht, was der US-Internetriese liefert - für sie ist seine Sicht des Webs gut genug.

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen

0 Kommentare

  • Noch keine Kommentare vorhanden.
    Starten Sie jetzt eine spannende Diskussion!