Metadaten lassen tief blicken

ÜBERWACHUNG Geheimdienste interessieren sich dafür, wer wann mit wem telefoniert. Ein Forschungsprojekt zeigt: Schon diese Daten verraten einiges

BERLIN taz | Ob Marina, Olympia oder Evil Olive – Programme des US-Geheimdienstes NSA dienen nicht immer dazu, Inhalte von Kommunikationen zu analysieren, sondern auch zum Abschöpfen von Metadaten. Also etwa die Frage, wer zu welchem Zeitpunkt mit wem telefoniert oder eine SMS verschickt hat. Die Frage, wie viel sich aus solchen Informationen über die Nutzer herausfinden lässt, will nun ein Forschungsprojekt an der Universität Stanford beantworten.

Verteidiger von Überwachungsmaßnahmen wenden stets ein, dass das Sammeln von Metadaten kaum in die Privatsphäre eingreift – schließlich würden die Inhalte von Kommunikationen dabei nicht erfasst. Um zu überprüfen, wie viel die Daten tatsächlich verraten, analysieren die Forscher aus Stanford mithilfe einer App die Metadaten von freiwilligen Teilnehmern. Vor drei Wochen haben sie damit angefangen und können bereits erste Ergebnisse vermelden: Allein anhand der Metadaten lässt sich erkennen, ob sich der Nutzer in einer Beziehung befindet oder nicht – und wenn ja, welche Nummer der Partner hat.

„Das zweite Problem ließ sich sehr viel einfacher lösen“, schreiben Jonathan Mayer und Patrick Mutchler im Blog Webpolicy. Denn im Teilnehmerfeld sei diese Nummer bei 60 Prozent der Teilnehmer die am häufigsten angerufene, bei 70 Prozent gehen die meisten Textnachrichten an die Person. Natürlich ließen sich diese Zahlen mit weiteren Merkmalen verbessern, schreiben die Autoren. Doch es zeige, wie viel sich schon mit sehr wenigen Mitteln aus den Metadaten herausfinden lasse.

Forscher des Massachusetts Institute of Technology (MIT) hatten im Frühjahr Forschungsergebnisse veröffentlicht, die die Annahme der Stanforder Forscher ebenfalls stützen. Sie hatten Standortdaten von 1,5 Millionen Nutzern über einen Zeitraum von 15 Monaten ausgewertet und dabei eine Formel für die Einzigartigkeit der Bewegungsspuren entwickelt. Das Ergebnis: Orts- und Zeitangaben an vier zufällig ausgewählte Punkten reichen aus, um 95 Prozent der Nutzer zu identifizieren. Mit höchstens elf Informationen darüber, wann sich wer wo aufgehalten hat, gelinge das sogar für jeden Nutzer. SVENJA BERGT