Algorithmen im Internet: Ihnen könnte dieser Artikel gefallen

Ein Amazon-Programmierer hat in den Neunzigern eine Idee, die sich zum mächtigsten Empfehlungsmechanismus im Netz entwickelt.

Wenn einem das genau richtige Buch empfohlen wird, ist das eine gute Rechenleistung – und ein bisschen Zufall. Oder Magie. Bild: complize / photocase.com

SILICON VALLEY taz | Als Greg Linden vor vierzehn Jahren die Gleichung entwarf, die heute noch das Internet ordnet, hatte ihn niemand darum gebeten. Er dachte nur, dass das mit den Buchempfehlungen besser gehen müsste.

1998 ist Amazon ein wachsendes Start-up in Seattle, an der Westküste der USA, das seinen Online-Buchhandel gerade auf Deutschland ausweitet. Linden, der junge Programmierer, ist direkt von der Uni zu Amazon gekommen, sein Schreibtisch aus Pappe steht in der Teeküche. Er sichtet Zeilen des Codes, die amazon.com steuern, korrigiert sie, denkt sich neue aus. Er will dafür sorgen, dass Amazon mindestens so guten Rat liefert, wie es Händlerinnen in den Geschäften tun. Welche Bücher könnten einer Kundin gefallen?

Die Software, die den Rat errechnen soll, heißt BookMatcher. Greg Linden allerdings gehört nicht zum Team, das sie entwickelt. Zwischendurch, wenn er Zeit hat, denkt er trotzdem darüber nach.

Aufwendige Rechenprozedur

Programme, die im Internet Empfehlungen ausrechnen, tun das damals, indem sie Kunden miteinander vergleichen. Manche ordnen sie in Gruppen an. Die, die Wirtschaftsbücher gekauft haben. Die mit den Groschenromanen. Innerhalb so einer Gruppe werden dann aus einer Liste von Büchern die Empfehlungen ausgewählt. Der Vergleich all dieser Kunden ist eine aufwendige Rechenprozedur. Die Masse der Amazon-Kundinnen wächst, die Geschwindigkeit des BookMatcher sinkt.

Was, wenn man nicht Kundinnen und Käufe gruppiert, sondern zuerst die gekauften Bücher vergleicht, fragt sich Linden. Man könnte in einer Datenbank im Hintergrund ähnliche Bücher suchen und sie dann in einem nächsten Schritt den Kundinnen vorschlagen. Die größte Rechenleistung würde in der Datenbank geschehen, offline. Es ginge schneller und die Treffer wären besser. Mit zwei Kollegen meldet Linden das Patent an.

Der Algorithmus heißt „Item-to-Item Collaborative Filtering“, weil Gemeinsamkeiten Artikel für Artikel abgeglichen werden.

„Kunden, die diesen Artikel gekauft haben, kauften auch …“ Ein Satz, der Unbehagen auslöst. Woher wissen die das?

Millionen Menschen wird zum ersten Mal richtig bewusst, dass die Spuren, die sie beim Surfen, beim Kaufen auf Internetseiten hinterlassen, festgehalten werden. Dass jemand sie verwendet, um zu beeinflussen, was sie künftig auf diesen Webseiten ansehen oder bestellen.

Die Macht der Codezeilen

Aus Lindens Patent wird der zentrale Empfehlungsmechanismus des Internets, den heute auch Google und YouTube verwenden. Er schlägt Filme oder Bücher oft zielsicherer vor, als es Buchhändler oder Freunde könnten. Es bleibt dieses Unbehagen: Welche Macht haben Codezeilen entwickelt?

Algorithmen steuern den Börsenhandel, sie wählen die Nachrichten auf unserer Startseite aus, sie legen Preise in Online-Shops fest und zeigen uns, was sogenannte FreundInnen gerade auf Facebook machen. Algorithmen treffen Entscheidungen, die die Aura des Unparteiischen, des Unantastbaren haben. Algorithmen sind das Argument, hinter dem sich Google verschanzen kann, wenn hinterfragt wird, warum es zum Namen „Bettina Wulff“ immer gleich „Escort“ vorschlägt. Algorithmen sind so allgegenwärtig geworden, dass Miriam Meckel sich in ihrem Buch „Next“ schon eine Zukunft ohne den Menschen vorstellt. Algorithmen regieren.

Die ersten Zeilen tippt ein Mensch

Im Grunde aber ist ein Algorithmus nicht viel mehr als eine Kette von Entscheidungen. Ja, nein. Wenn, dann. Eine Abfolge von Begriffen, Ziffern, Klammern, Unterstrichen. Und auch wenn es längst Entscheidungsketten gibt, die andere Entscheidungsketten schaffen, die dann neue Entscheidungsketten entwerfen, die wiederum … Die ersten Zeilen tippt meist ein Mensch. Auch die Informationen, die damit verarbeitet werden, liefern Menschen.

„Weil die Daten für die Empfehlungen von Menschen kommen, geht es eigentlich um Menschen, die etwas austauschen“, findet Greg Linden, der Erfinder des Amazon-Algorithmus. „Es sind Computer, die Menschen helfen, auszutauschen, was sie gefunden haben. Computer helfen Menschen dabei, anderen Menschen zu helfen“, schreibt er in einer Mail aus Seattle.

Menschen, die helfen. Manchmal sind die großen Fragen des Internets Glaubensfragen. Greg Linden glaubt, dass Algorithmen etwas Gutes sind.

Der Mensch, der die Algorithmen der Videoplattform YouTube beaufsichtigt, heißt Cristos Goodrow. An diesem Morgen in einem kalifornischen Konferenzraum trägt er eine graue Hose und ein blaues Hemd. Goodrow wirkt wie einer, der Abende oft im Fitnessstudio verbringt. Sein Lachen ist angenehm laut.

YouTube begann 2008, mit Greg Lindens Gleichungen zu arbeiten, zehn Jahre nachdem er sein Patent anmeldete. Manchmal entwickelt sich das Internet langsamer, als man denkt.

Wissen, dass sie irgendwie zusammengehören

Bei YouTube misst der Algorithmus vor allem, ob Videos nacheinander angesehen werden. Das deutet darauf hin, dass sie sich ähnlich sind. „Wir wissen gar nicht, worum es in diesen Videos geht. Aber wir wissen, dass sie irgendwie zusammengehören“, sagt Goodrow. Eine „mächtige Technik“ sei Lindens Gleichung.

Millionen Menschen, die Youtube-Clips anklicken, liefern mit ihrem Verhalten Erklärungsmuster, die nur für die Rechenformel Sinn ergeben kann. Mittlerweile bezieht sie ein, wie lange ein Video angesehen wird. Wenn jemand nach dem ersten Klick abbricht, ist das für Goodrow ein Zeichen, dass es nicht das war, wonach er gesucht hatte.

Im nächsten Schritt werden die verwandten Videos in eine Reihenfolge gebracht. Wann wurde es gesehen, wo? Welcher Clip wurde davor angeschaut? Wofür hat sich der Nutzer sonst interessiert? Goodrows Leute wählen die Parameter aus, die Gleichungen erledigen den Rest.

Der Algorithmus habe nur einen Nachteil, sagt Goodrow: Er braucht Zeit. „Wir müssen warten, bis möglichst viele Menschen die Videos angesehen haben.“ Nur so lassen sich deren Verbindungen ermitteln.

Mainstream-Filterblase?

Clips, die kaum gesehen werden, sind schwerer einzuordnen. Was beliebt ist, wird auch oft empfohlen. Schafft das nicht eine Mainstream-Filterblase? Es sei auf YouTube Platz für Nischen, für unterschiedlichste Interessen, sagt Goodrow.

Greg Lindens Algorithmus hat erst im Laufe der Jahre seine volle Kraft entfaltet. Er wird immer besser, je mehr Daten er durchwühlen kann.

Facebook, Amazon und Google hätten mit Empfehlungen experimentiert, die sich Menschen gegenseitig geben, ohne maschinelle Vermittlung. Viel zu aufwändig, sagt Linden. Nach Rat fragen, sich durch all die Antworten arbeiten, gute finden.

Seit einigen Wochen wirkt seine Formel auch auf google.de. Neben der Trefferliste schafft er dort eine Empfehlungsreihe: „Wird auch oft gesucht“. Wer etwa „Obama“ eingibt, dem wird eine Liste anderer Personen vorgeschlagen, nach denen man suchen könnte.

Emily Moxley ist 29 Jahre alt und hat ihr Büro in Mountain View, Kalifornien, in einem Gebäude mit vielen Glasscheiben, vor dem Palmen stehen und Fahrräder, die gelb-grün-blau-rot angestrichen sind. Die Unternehmenszentrale von Google. Moxley kümmert sich um die Empfehlungsliste, die Teil von etwas ist, das sie bei Google den Knowledge Graph nennen. Der präsentiert neben der Trefferliste in einer Art Steckbrief zentrale Informationen zum Suchbegriff, fast wie eine winzige Wikipedia-Seite neben den Google-Treffern.

Obama, dann Romney

Wenn jemand nach „Obama“ gesucht hat, wonach wird er wohl als Nächstes suchen? Mitt Romney, George W. Bush, Michelle Obama ist Googles Antwort. 500 Millionen Objekte zählt der Knowledge Graph. Jedes wird mit allen anderen abgeglichen.

Man muss den Algorithmus steuern und verfeinern. Sonst bekommt man ein Justin-Bieber-Problem. „Wonach auch immer Sie gerade suchen“, sagt Emily Moxley. „Es gibt ein paar Dinge, die überall so beliebt sind, dass man mit einer gewissen Wahrscheinlichkeit davon ausgehen kann, dass Ihre nächste Suche sich darauf beziehen wird. Justin Bieber etwa. Man muss das Gewicht dieser global beliebten Begriffe reduzieren, sonst würde Bieber ständig empfohlen.“

Tom Hanks, Meg Ryan. Zwei Schauspieler, ein Film. Klar, dass die gemeinsam auftauchen, sagt Moxley. Manche Muster allerdings, die der Algorithmus aus den Daten schält, können sie sich nicht erklären.

Die Magie der Algorithmen

Da wird ihr ein Buch empfohlen, weil sie ein anderes gelesen hat. Es ist genau das richtige Buch für sie. Aber warum? „Das ist die Magie“, sagt Emily Moxley. Die Magie der Algorithmen. Das macht sie so unheimlich.

Der Mensch gibt ihr Befehle und die Maschine zeigt ihm Dinge, die er nicht versteht.

Kann der einstige Amazon-Programmierer Greg Linden nachvollziehen, dass das Unbehagen schafft?

„Ich weiß nicht“, schreibt er. Dieses Unbehagen beruhe doch auf der fälschlichen Annahme, dass die Maschine das alles selbst macht. Sie helfe aber nur den Menschen, sich gegenseitig zu helfen. Wie gesagt.

Linden ist 40 Jahre alt und wohnt mit Frau und Kindern in Seattle. Er sagt, er sei weitestgehend in Rente. Die ersten Amazon-Angestellten haben großzügige Aktienanteile erhalten.

Für seine Erfindung bekam er damals einen alten Nike-Schuh. Eine seltsame Sitte, die Amazon-Chef Jeff Bezos eingeführt hatte. Der „Just-do-it“-Preis.

Dieser Text erscheint in der sonntaz vom 29. Dezember. Ein ganzes Heft zur Frage: Wem gehört das Internet?