Hype um Big Data: Metafehler Mensch

Prism! Big Data! Politik, Geheimdienste und Wirtschaft spähen unsere Daten aus. Das unberechenbare Verhalten des Menschen steht dem entgegen.

Daten kommen, Daten gehen, und so mancher sammelt eifrig. Bild: photocase / deyangeorgiev

Von je einem Ende der Welt flogen sie aufeinander zu und trafen sich in der Mitte. Zeus‘ Adler bestimmten das neue Zentrum der Welt. So entstand dem Mythos zufolge auch die wichtigste Kultstätte der hellenistischen Welt: das Orakel von Delphi.

Enden des Internets sind heute, de:official&client=firefox-a:von ein paar Spaßseiten abgesehen, nicht bekannt. Auch eine Mitte fehlt. Und doch, so will es der moderne Mythos, sind die Algorithmen eines Datengottes aufgestiegen und haben sich im Zentrum des Netzes getroffen. Es soll alle Eigenschaften besitzen, um die wichtigste Kultstätte der digitalen und nicht-digitalen Welt der näheren Zukunft zu werden: das Orakel von Big Data.

Krankheitsdiagnosen, Kindererziehung, sich selbst steuernde Autos, Logistikplanung, Verbrechensbekämpfung, Linguistik und Kreditwesen, Psychologie und Steuererhebung – wenn man sich den vielen neuen Berichten, Analysen und Büchern zum Thema ausliefert, gibt es nur wenig, was Big Data bald angeblich nicht vorhersagen kann. Big Data bedeutet: all jene verfügbaren Daten maschinell zu verarbeiten, die bisher wegen ihrer schieren Menge überwiegend unbearbeitet blieben.

“Unternehmen, Regierungen und auch Individuen werden alles, was möglich ist, erfassen, messen und optimieren“, betonen Viktor Mayer-Schönberger und Kenneth Cukier im Magazin Technology Review und in ihrem Buch „Big Data: A Revolution That Will Transform How We Live, Work, and Think“. Damit bringen sie auf den Punkt, was Unternehmen begeistert und Datenschützer ängstigt. Angst? Ja, erstmal zu Recht: Messen. Erfassen. Optimieren. Alles. Big Data. Wie das klingt. Da erodiert das Private schon beim Zuhören. Schlagworte ermorden die Freiheit. Gemessen und für manipuliert befunden. Big Brother is optimizing you.

Die Nachrichtenagentur AP berichtet auf ihrer englischsprachigen Seite, das vom US-Geheimdienst National Security Agency (NSA) gesteuerte Überwachungsprogramm Prism sei nur „ein relativ kleiner Teil eines wesentlich umfassenderen Abhörprogrammes“.

An Netzknotenpunkten greife die Behörde zu, „kopiere den Internet-Traffic, der die USA erreicht oder verlässt, und leite ihn für Analysezwecke weiter“. Zuvor hatten bereits US-Politiker ein größeres Ausmaß von Prism angedeutet. Die demokratische Senatorin Loretta Sanchez etwa sagte, Prism sei „nur die Spitze des Eisbergs“.

Aber wird der Mensch, den sich Programmierer, Datenanalytiker und Hardwareentwickler oft als Dümmsten Anzunehmenden User (DAU) vorstellen, das einfach so über sich ergehen lassen? Viele DAU zwangen zuletzt Microsoft, wieder einen Startbutton ins neue Betriebssystem einzufügen. Nicht etwa, weil man ihn braucht. Sondern weil er immer schon da war.

Lange galt Big Data als Zukunftsvision. Doch die Aktualität liefert schneller: Der US-Geheimdienst NSA hat Daten aus der gesamten vernetzten Welt gefischt. Britische Suchanfragen, deutscher E-Mail-Verkehr, US-Chats, finnische Internettelefonie – alles ist in eine gigantische Rasterfahndung namens „Prism“ der US-Terrorabwehr eingeflossen.

Big Data und „Prism“

Der Geheimdienst sagt, es seien nur Metadaten gesammelt worden. Barack Obama betont, niemand höre Telefonate direkt ab. Die US-Bürgerrechtsorganisation EFF schlägt den Bogen zu Big Data und spottet: „Sie wissen, dass du die Suizidpräventionshilfe von der Golden Gate Bridge aus angerufen hast, aber sie wissen nicht, was gesprochen wurde.“ Metadaten sagen manchmal genügend aus.

Das Magazin Slate stellt die richtige Frage. Wenn die NSA beim Auslesen von Facebook-Seiten auch die Freunde einer Zielperson und die Freunde der Freunde einbezieht, um Personenprofile und Verbindungen zu erfassen, dann sind statt einer schnell 226.000 Personen zu untersuchen. 226.000 Personen sind aber nicht einfach 226.000 Datensätze, es sind im schlimmsten Fall 226.000 potenzielle DAU.

Und sonst? Einer der mächtigsten Geheimdienste der Welt übt sich in Big Data. Das Ganze fliegt auf, weil eine einzelne Person nicht mehr mitmachen will. Hier wird deutlich, warum sich Big-Data-Analytiker vor dem menschlichen Faktor fürchten: Der Mensch als Summe seiner Unberechenbarkeit, Launen, Unzuverlässigkeit und Widerspenstigkeit. Freundlicher gesagt: Willkommen seist du, Mensch, mit all deinen Stärken und Schwächen, deinen Eitelkeiten, deinem Misstrauen und deiner radikalen Ichbezogenheit. Aber auch mit deiner Leidenschaft, viele Daten im Netz zu hinterlassen.

Meine Daten, deine Daten

Wir legen Profile auf Facebook, Twitter und Google+ an, posten Statusmeldung um Statusmeldung, suchen mit Google, Yahoo und Bing, kaufen ein bei Ebay und Amazon, machen Online-Banking, speichern unsere Daten in der Cloud, während mit den Eltern geskypt und mit den Kindern gechattet wird.

Sind wir selber schuld, wenn nun all diese Daten auf uns zurückfallen? Mayer-Schönberger und Cukier winken ab: falsche Frage. Die richtige laute: Wie können Daten helfen, die Welt zu verstehen? Wie nützlich sei doch Google und sein Umgang mit Daten. Lange bevor die Grippe ausbricht, gibt es schon die "Google-Flu-Trends“.

Auch Chris Anderson, ehemaliger Chefredaktion des Magazins Wired, sieht sich Google und Big Data an. Er fragt: „Was kann die Menschheit von Google lernen?“ Das Netz sei angewandte Mathematik, eine Mischung aus Forschung und Ingenieurswissen, die Genentschlüsselung des Menschen wird hier zur ersten großen Leistung von Big Data. Wir müssten, so Anderson weiter, auch nicht alles messen, erfassen, optimieren – schließlich gelte der Satz des Statistikers George Box: „Alle Modelle sind falsch, aber einige sind nützlich.“ Google-Manager Peter Norvig springt ihm bei und ändert Box‘ Zitat: „Alle Modelle sind falsch, aber ohne sie wird man kaum noch Erfolg haben“.

Was also kann denn der Mensch von Google lernen? Das Big-Data-Prinzip heißt: Korrelation ersetzt Kausalität. In welcher Beziehung X zu Y steht, hat Vorrang vor den Gründen, warum X so ist, wie er ist. Wichtiger als die Wissenschaft vom Leben, die Biologie, ist Bio-Engeneering. Wer braucht ein Studium Generale, wenn es Informatik und Datenverarbeitung doch auch tun? Da lacht sie, die dekontextualisierte, entsozialisierte, unsemantische und an Logik nicht interessierte Welt der reinen Datenanlyse.

Lob des Menschen und seiner Schwächen

Wir kennen Big Data schon länger als es diesen Begriff überhaupt gibt. Wir Deutschen kennen ihn vom Zensus 2011, nach dem plötzlich 1,5 Millionen Bürger fehlten, vom Berliner Großflughafen, der nicht fertig werden will, von Stuttgart 21. Wir Weltbürger verfolgen einen Drohnenkrieg, der trotz Milliarden Dollar und immer neuer Technologie in den Bergen Afghanistans nur selten Erfolg hat.

Genüsslich breiten Mayer-Schönberger und Cukier aus, wie der Zahlenfetischist Robert McNamara auf solider Datengrundlage den Vietnamkrieg verlor. Realistische Beurteilungen, sagte der damalige US-Verteidigungsminister, seien nur auf der Grundlage verlässlicher Statistiken möglich. Die Datenmengen standen der US-Armee zur Verfügung, es gewann der Vietcong. „Wir lagen falsch, furchtbar falsch“, schrieb McNamara später in seinen Memoiren.

Dana Boyd, Social-Media-Forscherin, meint:“In unserer Ära sind Daten billig, aber Sinn daraus zu ziehen ist es nicht“. Nur weil große Mengen an Daten verfügbar seien, müssten sie noch lange nicht viel wert sein. Zu viele Daten, fehlerhafte Daten, sinnlose Daten, zu wenige Daten – schön ist die Vorstellung, wie ein US-Geheimdienst versucht mit einer digitalen Übersetzungshilfe die Kommentare im taz.de-Forum zu verstehen.

Menschen machen im Netz Fehler um Fehler. Für Maschinen, die mit Maschinen kommunizieren sollen, um fehlerfrei Metadaten zu messen, zu erfassen und zu optimieren, ist der Mensch ein Metafehler. Das ist gut für uns und schlecht für Big Data. Beim Orakel von Delphi brauchte es noch ein Edikt des Kaisers, um der Wahrsagerei ein Ende zu bereiten. Beim Orakel von Big Data sollte menschliches Alltagsverhalten reichen. Der Rest ist guter Datenschutz.

Einmal zahlen
.

Fehler auf taz.de entdeckt?

Wir freuen uns über eine Mail an fehlerhinweis@taz.de!

Inhaltliches Feedback?

Gerne als Leser*innenkommentar unter dem Text auf taz.de oder über das Kontaktformular.

Das finden Sie gut? Bereits 5 Euro monatlich helfen, taz.de auch weiterhin frei zugänglich zu halten. Für alle.

Bitte registrieren Sie sich und halten Sie sich an unsere Netiquette.

Haben Sie Probleme beim Kommentieren oder Registrieren?

Dann mailen Sie uns bitte an kommune@taz.de.