piwik no script img

Algorithmen im InternetIhnen könnte dieser Artikel gefallen

Ein Amazon-Programmierer hat in den Neunzigern eine Idee, die sich zum mächtigsten Empfehlungsmechanismus im Netz entwickelt.

Wenn einem das genau richtige Buch empfohlen wird, ist das eine gute Rechenleistung – und ein bisschen Zufall. Oder Magie. Bild: complize / photocase.com

SILICON VALLEY taz | Als Greg Linden vor vierzehn Jahren die Gleichung entwarf, die heute noch das Internet ordnet, hatte ihn niemand darum gebeten. Er dachte nur, dass das mit den Buchempfehlungen besser gehen müsste.

1998 ist Amazon ein wachsendes Start-up in Seattle, an der Westküste der USA, das seinen Online-Buchhandel gerade auf Deutschland ausweitet. Linden, der junge Programmierer, ist direkt von der Uni zu Amazon gekommen, sein Schreibtisch aus Pappe steht in der Teeküche. Er sichtet Zeilen des Codes, die amazon.com steuern, korrigiert sie, denkt sich neue aus. Er will dafür sorgen, dass Amazon mindestens so guten Rat liefert, wie es Händlerinnen in den Geschäften tun. Welche Bücher könnten einer Kundin gefallen?

Die Software, die den Rat errechnen soll, heißt BookMatcher. Greg Linden allerdings gehört nicht zum Team, das sie entwickelt. Zwischendurch, wenn er Zeit hat, denkt er trotzdem darüber nach.

Aufwendige Rechenprozedur

Programme, die im Internet Empfehlungen ausrechnen, tun das damals, indem sie Kunden miteinander vergleichen. Manche ordnen sie in Gruppen an. Die, die Wirtschaftsbücher gekauft haben. Die mit den Groschenromanen. Innerhalb so einer Gruppe werden dann aus einer Liste von Büchern die Empfehlungen ausgewählt. Der Vergleich all dieser Kunden ist eine aufwendige Rechenprozedur. Die Masse der Amazon-Kundinnen wächst, die Geschwindigkeit des BookMatcher sinkt.

Was, wenn man nicht Kundinnen und Käufe gruppiert, sondern zuerst die gekauften Bücher vergleicht, fragt sich Linden. Man könnte in einer Datenbank im Hintergrund ähnliche Bücher suchen und sie dann in einem nächsten Schritt den Kundinnen vorschlagen. Die größte Rechenleistung würde in der Datenbank geschehen, offline. Es ginge schneller und die Treffer wären besser. Mit zwei Kollegen meldet Linden das Patent an.

Der Algorithmus heißt „Item-to-Item Collaborative Filtering“, weil Gemeinsamkeiten Artikel für Artikel abgeglichen werden.

„Kunden, die diesen Artikel gekauft haben, kauften auch …“ Ein Satz, der Unbehagen auslöst. Woher wissen die das?

Millionen Menschen wird zum ersten Mal richtig bewusst, dass die Spuren, die sie beim Surfen, beim Kaufen auf Internetseiten hinterlassen, festgehalten werden. Dass jemand sie verwendet, um zu beeinflussen, was sie künftig auf diesen Webseiten ansehen oder bestellen.

Die Macht der Codezeilen

Aus Lindens Patent wird der zentrale Empfehlungsmechanismus des Internets, den heute auch Google und YouTube verwenden. Er schlägt Filme oder Bücher oft zielsicherer vor, als es Buchhändler oder Freunde könnten. Es bleibt dieses Unbehagen: Welche Macht haben Codezeilen entwickelt?

Algorithmen steuern den Börsenhandel, sie wählen die Nachrichten auf unserer Startseite aus, sie legen Preise in Online-Shops fest und zeigen uns, was sogenannte FreundInnen gerade auf Facebook machen. Algorithmen treffen Entscheidungen, die die Aura des Unparteiischen, des Unantastbaren haben. Algorithmen sind das Argument, hinter dem sich Google verschanzen kann, wenn hinterfragt wird, warum es zum Namen „Bettina Wulff“ immer gleich „Escort“ vorschlägt. Algorithmen sind so allgegenwärtig geworden, dass Miriam Meckel sich in ihrem Buch „Next“ schon eine Zukunft ohne den Menschen vorstellt. Algorithmen regieren.

Die ersten Zeilen tippt ein Mensch

Im Grunde aber ist ein Algorithmus nicht viel mehr als eine Kette von Entscheidungen. Ja, nein. Wenn, dann. Eine Abfolge von Begriffen, Ziffern, Klammern, Unterstrichen. Und auch wenn es längst Entscheidungsketten gibt, die andere Entscheidungsketten schaffen, die dann neue Entscheidungsketten entwerfen, die wiederum … Die ersten Zeilen tippt meist ein Mensch. Auch die Informationen, die damit verarbeitet werden, liefern Menschen.

„Weil die Daten für die Empfehlungen von Menschen kommen, geht es eigentlich um Menschen, die etwas austauschen“, findet Greg Linden, der Erfinder des Amazon-Algorithmus. „Es sind Computer, die Menschen helfen, auszutauschen, was sie gefunden haben. Computer helfen Menschen dabei, anderen Menschen zu helfen“, schreibt er in einer Mail aus Seattle.

Bild: taz

Wem gehört das Internet? Amazon oder Wikileaks? Anonymous oder Facebook? In der sonntaz vom 29. Dezember widmen wir uns den Machtverhältnissen im Netz. Wir erzählen, wie Amazon unsere Wünsche aus seinen Daten liest, wie ein Pop-Song um die Welt treibt und wie Facebook uns zu Dauergrinsern macht. Yeah! Am Kiosk, eKiosk oder gleich im Wochenendabo. Und für Fans und Freunde: facebook.com/sonntaz.

Menschen, die helfen. Manchmal sind die großen Fragen des Internets Glaubensfragen. Greg Linden glaubt, dass Algorithmen etwas Gutes sind.

Der Mensch, der die Algorithmen der Videoplattform YouTube beaufsichtigt, heißt Cristos Goodrow. An diesem Morgen in einem kalifornischen Konferenzraum trägt er eine graue Hose und ein blaues Hemd. Goodrow wirkt wie einer, der Abende oft im Fitnessstudio verbringt. Sein Lachen ist angenehm laut.

YouTube begann 2008, mit Greg Lindens Gleichungen zu arbeiten, zehn Jahre nachdem er sein Patent anmeldete. Manchmal entwickelt sich das Internet langsamer, als man denkt.

Wissen, dass sie irgendwie zusammengehören

Bei YouTube misst der Algorithmus vor allem, ob Videos nacheinander angesehen werden. Das deutet darauf hin, dass sie sich ähnlich sind. „Wir wissen gar nicht, worum es in diesen Videos geht. Aber wir wissen, dass sie irgendwie zusammengehören“, sagt Goodrow. Eine „mächtige Technik“ sei Lindens Gleichung.

Millionen Menschen, die Youtube-Clips anklicken, liefern mit ihrem Verhalten Erklärungsmuster, die nur für die Rechenformel Sinn ergeben kann. Mittlerweile bezieht sie ein, wie lange ein Video angesehen wird. Wenn jemand nach dem ersten Klick abbricht, ist das für Goodrow ein Zeichen, dass es nicht das war, wonach er gesucht hatte.

Im nächsten Schritt werden die verwandten Videos in eine Reihenfolge gebracht. Wann wurde es gesehen, wo? Welcher Clip wurde davor angeschaut? Wofür hat sich der Nutzer sonst interessiert? Goodrows Leute wählen die Parameter aus, die Gleichungen erledigen den Rest.

Der Algorithmus habe nur einen Nachteil, sagt Goodrow: Er braucht Zeit. „Wir müssen warten, bis möglichst viele Menschen die Videos angesehen haben.“ Nur so lassen sich deren Verbindungen ermitteln.

Mainstream-Filterblase?

Clips, die kaum gesehen werden, sind schwerer einzuordnen. Was beliebt ist, wird auch oft empfohlen. Schafft das nicht eine Mainstream-Filterblase? Es sei auf YouTube Platz für Nischen, für unterschiedlichste Interessen, sagt Goodrow.

Greg Lindens Algorithmus hat erst im Laufe der Jahre seine volle Kraft entfaltet. Er wird immer besser, je mehr Daten er durchwühlen kann.

Facebook, Amazon und Google hätten mit Empfehlungen experimentiert, die sich Menschen gegenseitig geben, ohne maschinelle Vermittlung. Viel zu aufwändig, sagt Linden. Nach Rat fragen, sich durch all die Antworten arbeiten, gute finden.

Seit einigen Wochen wirkt seine Formel auch auf google.de. Neben der Trefferliste schafft er dort eine Empfehlungsreihe: „Wird auch oft gesucht“. Wer etwa „Obama“ eingibt, dem wird eine Liste anderer Personen vorgeschlagen, nach denen man suchen könnte.

Emily Moxley ist 29 Jahre alt und hat ihr Büro in Mountain View, Kalifornien, in einem Gebäude mit vielen Glasscheiben, vor dem Palmen stehen und Fahrräder, die gelb-grün-blau-rot angestrichen sind. Die Unternehmenszentrale von Google. Moxley kümmert sich um die Empfehlungsliste, die Teil von etwas ist, das sie bei Google den Knowledge Graph nennen. Der präsentiert neben der Trefferliste in einer Art Steckbrief zentrale Informationen zum Suchbegriff, fast wie eine winzige Wikipedia-Seite neben den Google-Treffern.

Obama, dann Romney

Wenn jemand nach „Obama“ gesucht hat, wonach wird er wohl als Nächstes suchen? Mitt Romney, George W. Bush, Michelle Obama ist Googles Antwort. 500 Millionen Objekte zählt der Knowledge Graph. Jedes wird mit allen anderen abgeglichen.

Man muss den Algorithmus steuern und verfeinern. Sonst bekommt man ein Justin-Bieber-Problem. „Wonach auch immer Sie gerade suchen“, sagt Emily Moxley. „Es gibt ein paar Dinge, die überall so beliebt sind, dass man mit einer gewissen Wahrscheinlichkeit davon ausgehen kann, dass Ihre nächste Suche sich darauf beziehen wird. Justin Bieber etwa. Man muss das Gewicht dieser global beliebten Begriffe reduzieren, sonst würde Bieber ständig empfohlen.“

Tom Hanks, Meg Ryan. Zwei Schauspieler, ein Film. Klar, dass die gemeinsam auftauchen, sagt Moxley. Manche Muster allerdings, die der Algorithmus aus den Daten schält, können sie sich nicht erklären.

Die Magie der Algorithmen

Da wird ihr ein Buch empfohlen, weil sie ein anderes gelesen hat. Es ist genau das richtige Buch für sie. Aber warum? „Das ist die Magie“, sagt Emily Moxley. Die Magie der Algorithmen. Das macht sie so unheimlich.

Der Mensch gibt ihr Befehle und die Maschine zeigt ihm Dinge, die er nicht versteht.

Kann der einstige Amazon-Programmierer Greg Linden nachvollziehen, dass das Unbehagen schafft?

„Ich weiß nicht“, schreibt er. Dieses Unbehagen beruhe doch auf der fälschlichen Annahme, dass die Maschine das alles selbst macht. Sie helfe aber nur den Menschen, sich gegenseitig zu helfen. Wie gesagt.

Linden ist 40 Jahre alt und wohnt mit Frau und Kindern in Seattle. Er sagt, er sei weitestgehend in Rente. Die ersten Amazon-Angestellten haben großzügige Aktienanteile erhalten.

Für seine Erfindung bekam er damals einen alten Nike-Schuh. Eine seltsame Sitte, die Amazon-Chef Jeff Bezos eingeführt hatte. Der „Just-do-it“-Preis.

Dieser Text erscheint in der sonntaz vom 29. Dezember. Ein ganzes Heft zur Frage: Wem gehört das Internet?

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen

Mehr zum Thema

4 Kommentare

 / 
  • KK
    Karl K

    Danke für den informativen Beitrag.

     

    Greg Linden liegt richtig; er ist kein KI-Anhänger

    und der Glaube bleibt für die Kirche reserviert.

    Math-naturw. geschulte finden das normal.

     

    Algorithmen - sind von Menschen geschaffene Werkzeuge. Punkt.

    Nicht mehr und nicht weniger. Gut oder schlecht?

    Wat ne Kategorie!? Hängt vom Menschen ab.

     

    Und genau dann beginnt es - wenn nämlich aufgrund des Wissens über

    bevorzugte Suchfelder und Fragestellungen, dem einzelnen der Zugang

    zu anderen, relevanten, aber abweichenden Feldern verwehrt wird.

    Du also quasi im eigenen Saft schmorst.

    Das soll heute schon - auch bei allgemeinen Suchmaschinen Standard sein!?

    Dazu sagt der Beitrag leider nichts. HAL ließe dann in der Tat grüßen.

    Unbehagen is ja nett - Wissen wär besser.

  • M
    Moritz

    Außerdem ist die Idee auch, dass du trotzdem Individuelles bekommst.

    Ich beschäftige mich gerade zufällig in miner Jugend-Forscht Arbeit mit dem Thema, und weiß daher ziemlich genau, wie die Algorithmen so funktionieren.

     

    Und es können auch wenig gekaufte Bücher angezeigt werden, wenn Sie zu deinem Stil passen, wenn der Programmierer das will.

    Wenn du nur Nischenprodukte kaufst, dann wird dir ein guter Alogrithmus eben Nischenprodukte empfehlen.

    Du darfst zudem ja weiter die Suche benutzen; niemand hält dich auf!

     

    Noch ein kleiner Tipp: Wenn du Wissen willst, wie die Algorithmen funktionieren (und Programmieren kannst), dann ist eigentlich das ganze Wissen zu dem Thema frei verfügbar, ein sehr guter Einstieg zu dem Thema:

    http://www.oreilly.de/catalog/collintellger/

  • B
    basiro1

    ...aber lieber T.V.: wer verbietet das denn? Seien wir doch nicht paranoid- die Gefahren lauern ganz woanders! Wir leben in dieser Zeit und diesen technischen Möglichkeiten, ob wir sie nützen oder nicht bleibt doch uns überlassen. Einen schönen Tag wünscht basiro

  • T
    T.V.

    Das ist die Philosophie der Firmen für die Massen. Selber denken verboten.