Hype um Big Data: Metafehler Mensch
Prism! Big Data! Politik, Geheimdienste und Wirtschaft spähen unsere Daten aus. Das unberechenbare Verhalten des Menschen steht dem entgegen.
Von je einem Ende der Welt flogen sie aufeinander zu und trafen sich in der Mitte. Zeus‘ Adler bestimmten das neue Zentrum der Welt. So entstand dem Mythos zufolge auch die wichtigste Kultstätte der hellenistischen Welt: das Orakel von Delphi.
Enden des Internets sind heute, de:official&client=firefox-a:von ein paar Spaßseiten abgesehen, nicht bekannt. Auch eine Mitte fehlt. Und doch, so will es der moderne Mythos, sind die Algorithmen eines Datengottes aufgestiegen und haben sich im Zentrum des Netzes getroffen. Es soll alle Eigenschaften besitzen, um die wichtigste Kultstätte der digitalen und nicht-digitalen Welt der näheren Zukunft zu werden: das Orakel von Big Data.
Krankheitsdiagnosen, Kindererziehung, sich selbst steuernde Autos, Logistikplanung, Verbrechensbekämpfung, Linguistik und Kreditwesen, Psychologie und Steuererhebung – wenn man sich den vielen neuen Berichten, Analysen und Büchern zum Thema ausliefert, gibt es nur wenig, was Big Data bald angeblich nicht vorhersagen kann. Big Data bedeutet: all jene verfügbaren Daten maschinell zu verarbeiten, die bisher wegen ihrer schieren Menge überwiegend unbearbeitet blieben.
“Unternehmen, Regierungen und auch Individuen werden alles, was möglich ist, erfassen, messen und optimieren“, betonen Viktor Mayer-Schönberger und Kenneth Cukier im Magazin Technology Review und in ihrem Buch „Big Data: A Revolution That Will Transform How We Live, Work, and Think“. Damit bringen sie auf den Punkt, was Unternehmen begeistert und Datenschützer ängstigt. Angst? Ja, erstmal zu Recht: Messen. Erfassen. Optimieren. Alles. Big Data. Wie das klingt. Da erodiert das Private schon beim Zuhören. Schlagworte ermorden die Freiheit. Gemessen und für manipuliert befunden. Big Brother is optimizing you.
Die Nachrichtenagentur AP berichtet auf ihrer englischsprachigen Seite, das vom US-Geheimdienst National Security Agency (NSA) gesteuerte Überwachungsprogramm Prism sei nur „ein relativ kleiner Teil eines wesentlich umfassenderen Abhörprogrammes“.
An Netzknotenpunkten greife die Behörde zu, „kopiere den Internet-Traffic, der die USA erreicht oder verlässt, und leite ihn für Analysezwecke weiter“. Zuvor hatten bereits US-Politiker ein größeres Ausmaß von Prism angedeutet. Die demokratische Senatorin Loretta Sanchez etwa sagte, Prism sei „nur die Spitze des Eisbergs“.
Aber wird der Mensch, den sich Programmierer, Datenanalytiker und Hardwareentwickler oft als Dümmsten Anzunehmenden User (DAU) vorstellen, das einfach so über sich ergehen lassen? Viele DAU zwangen zuletzt Microsoft, wieder einen Startbutton ins neue Betriebssystem einzufügen. Nicht etwa, weil man ihn braucht. Sondern weil er immer schon da war.
Lange galt Big Data als Zukunftsvision. Doch die Aktualität liefert schneller: Der US-Geheimdienst NSA hat Daten aus der gesamten vernetzten Welt gefischt. Britische Suchanfragen, deutscher E-Mail-Verkehr, US-Chats, finnische Internettelefonie – alles ist in eine gigantische Rasterfahndung namens „Prism“ der US-Terrorabwehr eingeflossen.
Big Data und „Prism“
Der Geheimdienst sagt, es seien nur Metadaten gesammelt worden. Barack Obama betont, niemand höre Telefonate direkt ab. Die US-Bürgerrechtsorganisation EFF schlägt den Bogen zu Big Data und spottet: „Sie wissen, dass du die Suizidpräventionshilfe von der Golden Gate Bridge aus angerufen hast, aber sie wissen nicht, was gesprochen wurde.“ Metadaten sagen manchmal genügend aus.
Das Magazin Slate stellt die richtige Frage. Wenn die NSA beim Auslesen von Facebook-Seiten auch die Freunde einer Zielperson und die Freunde der Freunde einbezieht, um Personenprofile und Verbindungen zu erfassen, dann sind statt einer schnell 226.000 Personen zu untersuchen. 226.000 Personen sind aber nicht einfach 226.000 Datensätze, es sind im schlimmsten Fall 226.000 potenzielle DAU.
Und sonst? Einer der mächtigsten Geheimdienste der Welt übt sich in Big Data. Das Ganze fliegt auf, weil eine einzelne Person nicht mehr mitmachen will. Hier wird deutlich, warum sich Big-Data-Analytiker vor dem menschlichen Faktor fürchten: Der Mensch als Summe seiner Unberechenbarkeit, Launen, Unzuverlässigkeit und Widerspenstigkeit. Freundlicher gesagt: Willkommen seist du, Mensch, mit all deinen Stärken und Schwächen, deinen Eitelkeiten, deinem Misstrauen und deiner radikalen Ichbezogenheit. Aber auch mit deiner Leidenschaft, viele Daten im Netz zu hinterlassen.
Meine Daten, deine Daten
Wir legen Profile auf Facebook, Twitter und Google+ an, posten Statusmeldung um Statusmeldung, suchen mit Google, Yahoo und Bing, kaufen ein bei Ebay und Amazon, machen Online-Banking, speichern unsere Daten in der Cloud, während mit den Eltern geskypt und mit den Kindern gechattet wird.
ist Chef vom Dienst bei taz.de. Maik Söhler auf Twitter.
Sind wir selber schuld, wenn nun all diese Daten auf uns zurückfallen? Mayer-Schönberger und Cukier winken ab: falsche Frage. Die richtige laute: Wie können Daten helfen, die Welt zu verstehen? Wie nützlich sei doch Google und sein Umgang mit Daten. Lange bevor die Grippe ausbricht, gibt es schon die "Google-Flu-Trends“.
Auch Chris Anderson, ehemaliger Chefredaktion des Magazins Wired, sieht sich Google und Big Data an. Er fragt: „Was kann die Menschheit von Google lernen?“ Das Netz sei angewandte Mathematik, eine Mischung aus Forschung und Ingenieurswissen, die Genentschlüsselung des Menschen wird hier zur ersten großen Leistung von Big Data. Wir müssten, so Anderson weiter, auch nicht alles messen, erfassen, optimieren – schließlich gelte der Satz des Statistikers George Box: „Alle Modelle sind falsch, aber einige sind nützlich.“ Google-Manager Peter Norvig springt ihm bei und ändert Box‘ Zitat: „Alle Modelle sind falsch, aber ohne sie wird man kaum noch Erfolg haben“.
Was also kann denn der Mensch von Google lernen? Das Big-Data-Prinzip heißt: Korrelation ersetzt Kausalität. In welcher Beziehung X zu Y steht, hat Vorrang vor den Gründen, warum X so ist, wie er ist. Wichtiger als die Wissenschaft vom Leben, die Biologie, ist Bio-Engeneering. Wer braucht ein Studium Generale, wenn es Informatik und Datenverarbeitung doch auch tun? Da lacht sie, die dekontextualisierte, entsozialisierte, unsemantische und an Logik nicht interessierte Welt der reinen Datenanlyse.
Lob des Menschen und seiner Schwächen
Wir kennen Big Data schon länger als es diesen Begriff überhaupt gibt. Wir Deutschen kennen ihn vom Zensus 2011, nach dem plötzlich 1,5 Millionen Bürger fehlten, vom Berliner Großflughafen, der nicht fertig werden will, von Stuttgart 21. Wir Weltbürger verfolgen einen Drohnenkrieg, der trotz Milliarden Dollar und immer neuer Technologie in den Bergen Afghanistans nur selten Erfolg hat.
Genüsslich breiten Mayer-Schönberger und Cukier aus, wie der Zahlenfetischist Robert McNamara auf solider Datengrundlage den Vietnamkrieg verlor. Realistische Beurteilungen, sagte der damalige US-Verteidigungsminister, seien nur auf der Grundlage verlässlicher Statistiken möglich. Die Datenmengen standen der US-Armee zur Verfügung, es gewann der Vietcong. „Wir lagen falsch, furchtbar falsch“, schrieb McNamara später in seinen Memoiren.
Dana Boyd, Social-Media-Forscherin, meint:“In unserer Ära sind Daten billig, aber Sinn daraus zu ziehen ist es nicht“. Nur weil große Mengen an Daten verfügbar seien, müssten sie noch lange nicht viel wert sein. Zu viele Daten, fehlerhafte Daten, sinnlose Daten, zu wenige Daten – schön ist die Vorstellung, wie ein US-Geheimdienst versucht mit einer digitalen Übersetzungshilfe die Kommentare im taz.de-Forum zu verstehen.
Menschen machen im Netz Fehler um Fehler. Für Maschinen, die mit Maschinen kommunizieren sollen, um fehlerfrei Metadaten zu messen, zu erfassen und zu optimieren, ist der Mensch ein Metafehler. Das ist gut für uns und schlecht für Big Data. Beim Orakel von Delphi brauchte es noch ein Edikt des Kaisers, um der Wahrsagerei ein Ende zu bereiten. Beim Orakel von Big Data sollte menschliches Alltagsverhalten reichen. Der Rest ist guter Datenschutz.
taz lesen kann jede:r
Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen
meistkommentiert
Stockender Absatz von E-Autos
Woran liegt es?
Kürzungen im Berliner Haushalt
Kultur vor dem Aus
Bundestag bewilligt Rüstungsprojekte
Fürs Militär ist Kohle da
Grüne über das Gezerre um Paragraf 218
„Absolut unüblich und respektlos“
BSW-Chefin im ZDF
Wagenknecht räumt Irrtum vor russischem Angriff ein
Erfolg gegen Eigenbedarfskündigungen
Gericht ebnet neue Wege für Mieter, sich zu wehren