Algorithmen im Internet: Ihnen könnte dieser Artikel gefallen

178858 5076443

Algorithmen im Internet: Ihnen könnte dieser Artikel gefallen

Ein Amazon-Programmierer hat in den Neunzigern eine Idee, die sich zum mächtigsten Empfehlungsmechanismus im Netz entwickelt.

29.12.2012 11:11 Uhr

Wenn einem das genau richtige Buch empfohlen wird, ist das eine gute Rechenleistung – und ein bisschen Zufall. Oder Magie. Bild: complize / photocase.com

Von Johannes Gernert

SILICON VALLEY taz | Als Greg Linden vor vierzehn Jahren die Gleichung entwarf, die heute noch das Internet ordnet, hatte ihn niemand darum gebeten. Er dachte nur, dass das mit den Buchempfehlungen besser gehen müsste.

1998 ist Amazon ein wachsendes Start-up in Seattle, an der Westküste der USA, das seinen Online-Buchhandel gerade auf Deutschland ausweitet. Linden, der junge Programmierer, ist direkt von der Uni zu Amazon gekommen, sein Schreibtisch aus Pappe steht in der Teeküche. Er sichtet Zeilen des Codes, die amazon.com steuern, korrigiert sie, denkt sich neue aus. Er will dafür sorgen, dass Amazon mindestens so guten Rat liefert, wie es Händlerinnen in den Geschäften tun. Welche Bücher könnten einer Kundin gefallen?

Die Software, die den Rat errechnen soll, heißt BookMatcher. Greg Linden allerdings gehört nicht zum Team, das sie entwickelt. Zwischendurch, wenn er Zeit hat, denkt er trotzdem darüber nach.

Aufwendige Rechenprozedur

Programme, die im Internet Empfehlungen ausrechnen, tun das damals, indem sie Kunden miteinander vergleichen. Manche ordnen sie in Gruppen an. Die, die Wirtschaftsbücher gekauft haben. Die mit den Groschenromanen. Innerhalb so einer Gruppe werden dann aus einer Liste von Büchern die Empfehlungen ausgewählt. Der Vergleich all dieser Kunden ist eine aufwendige Rechenprozedur. Die Masse der Amazon-Kundinnen wächst, die Geschwindigkeit des BookMatcher sinkt.

Was, wenn man nicht Kundinnen und Käufe gruppiert, sondern zuerst die gekauften Bücher vergleicht, fragt sich Linden. Man könnte in einer Datenbank im Hintergrund ähnliche Bücher suchen und sie dann in einem nächsten Schritt den Kundinnen vorschlagen. Die größte Rechenleistung würde in der Datenbank geschehen, offline. Es ginge schneller und die Treffer wären besser. Mit zwei Kollegen meldet Linden das Patent an.

Der Algorithmus heißt „Item-to-Item Collaborative Filtering“, weil Gemeinsamkeiten Artikel für Artikel abgeglichen werden.

„Kunden, die diesen Artikel gekauft haben, kauften auch …“ Ein Satz, der Unbehagen auslöst. Woher wissen die das?

Millionen Menschen wird zum ersten Mal richtig bewusst, dass die Spuren, die sie beim Surfen, beim Kaufen auf Internetseiten hinterlassen, festgehalten werden. Dass jemand sie verwendet, um zu beeinflussen, was sie künftig auf diesen Webseiten ansehen oder bestellen.

Die Macht der Codezeilen

Aus Lindens Patent wird der zentrale Empfehlungsmechanismus des Internets, den heute auch Google und YouTube verwenden. Er schlägt Filme oder Bücher oft zielsicherer vor, als es Buchhändler oder Freunde könnten. Es bleibt dieses Unbehagen: Welche Macht haben Codezeilen entwickelt?

Algorithmen steuern den Börsenhandel, sie wählen die Nachrichten auf unserer Startseite aus, sie legen Preise in Online-Shops fest und zeigen uns, was sogenannte FreundInnen gerade auf Facebook machen. Algorithmen treffen Entscheidungen, die die Aura des Unparteiischen, des Unantastbaren haben. Algorithmen sind das Argument, hinter dem sich Google verschanzen kann, wenn hinterfragt wird, warum es zum Namen „Bettina Wulff“ immer gleich „Escort“ vorschlägt. Algorithmen sind so allgegenwärtig geworden, dass Miriam Meckel sich in ihrem Buch „Next“ schon eine Zukunft ohne den Menschen vorstellt. Algorithmen regieren.

Die ersten Zeilen tippt ein Mensch

Im Grunde aber ist ein Algorithmus nicht viel mehr als eine Kette von Entscheidungen. Ja, nein. Wenn, dann. Eine Abfolge von Begriffen, Ziffern, Klammern, Unterstrichen. Und auch wenn es längst Entscheidungsketten gibt, die andere Entscheidungsketten schaffen, die dann neue Entscheidungsketten entwerfen, die wiederum … Die ersten Zeilen tippt meist ein Mensch. Auch die Informationen, die damit verarbeitet werden, liefern Menschen.

„Weil die Daten für die Empfehlungen von Menschen kommen, geht es eigentlich um Menschen, die etwas austauschen“, findet Greg Linden, der Erfinder des Amazon-Algorithmus. „Es sind Computer, die Menschen helfen, auszutauschen, was sie gefunden haben. Computer helfen Menschen dabei, anderen Menschen zu helfen“, schreibt er in einer Mail aus Seattle.

Bild: taz

Wem gehört das Internet? Amazon oder Wikileaks? Anonymous oder Facebook? In der sonntaz vom 29. Dezember widmen wir uns den Machtverhältnissen im Netz. Wir erzählen, wie Amazon unsere Wünsche aus seinen Daten liest, wie ein Pop-Song um die Welt treibt und wie Facebook uns zu Dauergrinsern macht. Yeah! Am Kiosk, eKiosk oder gleich im Wochenendabo. Und für Fans und Freunde: facebook.com/sonntaz.

Menschen, die helfen. Manchmal sind die großen Fragen des Internets Glaubensfragen. Greg Linden glaubt, dass Algorithmen etwas Gutes sind.

Der Mensch, der die Algorithmen der Videoplattform YouTube beaufsichtigt, heißt Cristos Goodrow. An diesem Morgen in einem kalifornischen Konferenzraum trägt er eine graue Hose und ein blaues Hemd. Goodrow wirkt wie einer, der Abende oft im Fitnessstudio verbringt. Sein Lachen ist angenehm laut.

YouTube begann 2008, mit Greg Lindens Gleichungen zu arbeiten, zehn Jahre nachdem er sein Patent anmeldete. Manchmal entwickelt sich das Internet langsamer, als man denkt.

Wissen, dass sie irgendwie zusammengehören

Bei YouTube misst der Algorithmus vor allem, ob Videos nacheinander angesehen werden. Das deutet darauf hin, dass sie sich ähnlich sind. „Wir wissen gar nicht, worum es in diesen Videos geht. Aber wir wissen, dass sie irgendwie zusammengehören“, sagt Goodrow. Eine „mächtige Technik“ sei Lindens Gleichung.

Millionen Menschen, die Youtube-Clips anklicken, liefern mit ihrem Verhalten Erklärungsmuster, die nur für die Rechenformel Sinn ergeben kann. Mittlerweile bezieht sie ein, wie lange ein Video angesehen wird. Wenn jemand nach dem ersten Klick abbricht, ist das für Goodrow ein Zeichen, dass es nicht das war, wonach er gesucht hatte.

Im nächsten Schritt werden die verwandten Videos in eine Reihenfolge gebracht. Wann wurde es gesehen, wo? Welcher Clip wurde davor angeschaut? Wofür hat sich der Nutzer sonst interessiert? Goodrows Leute wählen die Parameter aus, die Gleichungen erledigen den Rest.

Der Algorithmus habe nur einen Nachteil, sagt Goodrow: Er braucht Zeit. „Wir müssen warten, bis möglichst viele Menschen die Videos angesehen haben.“ Nur so lassen sich deren Verbindungen ermitteln.

Mainstream-Filterblase?

Clips, die kaum gesehen werden, sind schwerer einzuordnen. Was beliebt ist, wird auch oft empfohlen. Schafft das nicht eine Mainstream-Filterblase? Es sei auf YouTube Platz für Nischen, für unterschiedlichste Interessen, sagt Goodrow.

Greg Lindens Algorithmus hat erst im Laufe der Jahre seine volle Kraft entfaltet. Er wird immer besser, je mehr Daten er durchwühlen kann.

Facebook, Amazon und Google hätten mit Empfehlungen experimentiert, die sich Menschen gegenseitig geben, ohne maschinelle Vermittlung. Viel zu aufwändig, sagt Linden. Nach Rat fragen, sich durch all die Antworten arbeiten, gute finden.

Seit einigen Wochen wirkt seine Formel auch auf google.de. Neben der Trefferliste schafft er dort eine Empfehlungsreihe: „Wird auch oft gesucht“. Wer etwa „Obama“ eingibt, dem wird eine Liste anderer Personen vorgeschlagen, nach denen man suchen könnte.

Emily Moxley ist 29 Jahre alt und hat ihr Büro in Mountain View, Kalifornien, in einem Gebäude mit vielen Glasscheiben, vor dem Palmen stehen und Fahrräder, die gelb-grün-blau-rot angestrichen sind. Die Unternehmenszentrale von Google. Moxley kümmert sich um die Empfehlungsliste, die Teil von etwas ist, das sie bei Google den Knowledge Graph nennen. Der präsentiert neben der Trefferliste in einer Art Steckbrief zentrale Informationen zum Suchbegriff, fast wie eine winzige Wikipedia-Seite neben den Google-Treffern.

Obama, dann Romney

Wenn jemand nach „Obama“ gesucht hat, wonach wird er wohl als Nächstes suchen? Mitt Romney, George W. Bush, Michelle Obama ist Googles Antwort. 500 Millionen Objekte zählt der Knowledge Graph. Jedes wird mit allen anderen abgeglichen.

Man muss den Algorithmus steuern und verfeinern. Sonst bekommt man ein Justin-Bieber-Problem. „Wonach auch immer Sie gerade suchen“, sagt Emily Moxley. „Es gibt ein paar Dinge, die überall so beliebt sind, dass man mit einer gewissen Wahrscheinlichkeit davon ausgehen kann, dass Ihre nächste Suche sich darauf beziehen wird. Justin Bieber etwa. Man muss das Gewicht dieser global beliebten Begriffe reduzieren, sonst würde Bieber ständig empfohlen.“

Tom Hanks, Meg Ryan. Zwei Schauspieler, ein Film. Klar, dass die gemeinsam auftauchen, sagt Moxley. Manche Muster allerdings, die der Algorithmus aus den Daten schält, können sie sich nicht erklären.

Die Magie der Algorithmen

Da wird ihr ein Buch empfohlen, weil sie ein anderes gelesen hat. Es ist genau das richtige Buch für sie. Aber warum? „Das ist die Magie“, sagt Emily Moxley. Die Magie der Algorithmen. Das macht sie so unheimlich.

Der Mensch gibt ihr Befehle und die Maschine zeigt ihm Dinge, die er nicht versteht.

Kann der einstige Amazon-Programmierer Greg Linden nachvollziehen, dass das Unbehagen schafft?

„Ich weiß nicht“, schreibt er. Dieses Unbehagen beruhe doch auf der fälschlichen Annahme, dass die Maschine das alles selbst macht. Sie helfe aber nur den Menschen, sich gegenseitig zu helfen. Wie gesagt.

Linden ist 40 Jahre alt und wohnt mit Frau und Kindern in Seattle. Er sagt, er sei weitestgehend in Rente. Die ersten Amazon-Angestellten haben großzügige Aktienanteile erhalten.

Für seine Erfindung bekam er damals einen alten Nike-Schuh. Eine seltsame Sitte, die Amazon-Chef Jeff Bezos eingeführt hatte. Der „Just-do-it“-Preis.

Dieser Text erscheint in der sonntaz vom 29. Dezember. Ein ganzes Heft zur Frage: Wem gehört das Internet?

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen

Themen #Algorithmus #Internet #Programmieren

Feedback Kommentieren Fehlerhinweis

Mehr zum Thema

Medientage München

Goldene Matratzen

Der Gründer von Ebay hat sich NSA-Enthüller Glenn Greenwald geholt, Amazon-Chef Jeff Bezos zuvor die „Washington Post“. Warum?

Von Jürn Kruse

Hype um Big Data

Big Brothers große Schwester

Die Stasi wollte noch jedes Individuum „kennenlernen“. Heutige Geheimdienste machen sich diese Mühe nicht mehr: Sie glauben „Big Data“ sei die Lösung.

Von Daniél Kretschmar

Neue Bücher übers Internet

Mit und ohne Fragezeichen

Worüber reden wir, wenn wir über das Netz reden? Und wer hat da noch mal die Macht? Zwei Bücher suchen nach Antworten.

Von Johannes Gernert

10 Ausgaben für 10 Euro

Die Wochenzeitung mit taz-Blick

Unsere wochentaz bietet jeden Samstag Journalismus, der es nicht allen recht macht und Stimmen, die man woanders nicht hört. Jetzt zehn Wochen lang kennenlernen.

Jetzt bestellen

4 Kommentare

KK
Karl K

30.12.2012, 17:10 Uhr

Danke für den informativen Beitrag.

Greg Linden liegt richtig; er ist kein KI-Anhänger

und der Glaube bleibt für die Kirche reserviert.

Math-naturw. geschulte finden das normal.

Algorithmen - sind von Menschen geschaffene Werkzeuge. Punkt.

Nicht mehr und nicht weniger. Gut oder schlecht?

Wat ne Kategorie!? Hängt vom Menschen ab.

Und genau dann beginnt es - wenn nämlich aufgrund des Wissens über

bevorzugte Suchfelder und Fragestellungen, dem einzelnen der Zugang

zu anderen, relevanten, aber abweichenden Feldern verwehrt wird.

Du also quasi im eigenen Saft schmorst.

Das soll heute schon - auch bei allgemeinen Suchmaschinen Standard sein!?

Dazu sagt der Beitrag leider nichts. HAL ließe dann in der Tat grüßen.

Unbehagen is ja nett - Wissen wär besser.
M
Moritz

30.12.2012, 15:39 Uhr

Außerdem ist die Idee auch, dass du trotzdem Individuelles bekommst.

Ich beschäftige mich gerade zufällig in miner Jugend-Forscht Arbeit mit dem Thema, und weiß daher ziemlich genau, wie die Algorithmen so funktionieren.

Und es können auch wenig gekaufte Bücher angezeigt werden, wenn Sie zu deinem Stil passen, wenn der Programmierer das will.

Wenn du nur Nischenprodukte kaufst, dann wird dir ein guter Alogrithmus eben Nischenprodukte empfehlen.

Du darfst zudem ja weiter die Suche benutzen; niemand hält dich auf!

Noch ein kleiner Tipp: Wenn du Wissen willst, wie die Algorithmen funktionieren (und Programmieren kannst), dann ist eigentlich das ganze Wissen zu dem Thema frei verfügbar, ein sehr guter Einstieg zu dem Thema:

http://www.oreilly.de/catalog/collintellger/
B
basiro1

30.12.2012, 10:14 Uhr

...aber lieber T.V.: wer verbietet das denn? Seien wir doch nicht paranoid- die Gefahren lauern ganz woanders! Wir leben in dieser Zeit und diesen technischen Möglichkeiten, ob wir sie nützen oder nicht bleibt doch uns überlassen. Einen schönen Tag wünscht basiro
T
T.V.

29.12.2012, 19:34 Uhr

Das ist die Philosophie der Firmen für die Massen. Selber denken verboten.

meistkommentiert

Politikwissenschaftlerin über Ukraine

„Land gegen Frieden funktioniert nicht“

Scholz und Pistorius

Journalismus oder Pferdewette?

Nan Goldin in Neuer Nationalgalerie

Claudia Roth entsetzt über Proteste

taz-Recherche zu Gewalt gegen Frauen

Eine ganz normale Woche in Deutschland

Internationaler Strafgerichtshof

Ein Haftbefehl und seine Folgen

Warnung vor „bestimmten Quartieren“

Eine alarmistische Debatte in Berlin