Recherche-Projekt „Paradise Papers“: How to megaenthüll

Die „Paradise Papers“ sind ein journalistischer Scoop – und das Thema der Woche. Nur: Wie wertet man diese riesigen Datenmengen überhaupt aus?

Ein Mann dreht an einem Ring, der an seinem Mittelfinger steckt

Goldig: Strategien für Steuerflucht Foto: ap

Man braucht eine Liste mit Promis, leistungsstarke Software und sichere Kommunikationswege. Und am Ende müssen sich dann noch 96 Redaktionen aus 67 Ländern über eine sinnvolle Dramaturgie abstimmen.

Es ist das zweite große Datenleak, das die Süddeutsche Zeitung in Zusammenarbeit mit internationalen Partnern ausgewertet hat: Die „Paradise Papers“, mit denen die Tageszeitung am Sonntagabend rausgerückt und damit das Thema der Woche gesetzt hat. Der Schlusspunkt eines Riesenprojekts. Am Anfang standen eine anonyme Quelle und 1,4 Terabyte Datenmaterial – am Ende Geschichten über die Offshore-Steuertricks bekannter Konzerne und Promis.

Sportartikelhersteller Nike etwa, so kam heraus, spart Steuern, indem er sich selbst, also seinen Tochterfirmen, Rechnungen schreibt, um den Gewinn zu drosseln. Und Formel-1-Weltmeister Lewis Hamilton verwandelte sich in eine Ein-Mann-Fluggesellschaft auf der Isle of Man, um dort einen knallroten Privatjet steuerfrei einzuführen. Auch Sänger Bono und die Queen tauchten auf. Und der ehemalige schleswig-holsteinische Ministerpräsident Peter Harry Carstensen musste erklären, warum er einem Museum vorsteht, das einer niederländischen Briefkastenfirma gehört.

Veröffentlichungen geheimer Datensätze, sogenannte Leaks, gewinnen im investigativen Journalismus an Bedeutung. Vor den „Paradise Papers“ hatten die „Panama Papers“ 2016 für Aufsehen gesorgt. Sie kosteten den isländischen und den pakistanischen Premier das Amt. 2014 enthüllten die „Lux-Leaks“ Steuervermeidungsstra­tegien internationaler Großkonzerne. Koordiniert wurden alle drei Projekte vom International Consortium of Investigative Journalists (ICIJ), einem Netzwerk investigativer JournalistInnen mit Sitz in Washington, D. C.

Wie aber gewinnt man aus 1,4 Terabyte Daten eine Hand voll knackiger Geschichten von medialer Schlagkraft? 1,4 Terabyte wäre so viel wie die PDFs von 585 taz-Jahrgängen. Dies nur als Vorstellungshilfe, denn so ein Leak besteht natürlich nicht aus Tageszeitungen, sondern aus einem Wust an Datenbanken, E-Mails, Scans und Fotos. Den zu bändigen ist allerdings kein Hexenwerk, sondern eine Frage von Organisation und technischem Wissen.

Vanessa Wormer, „SZ“

Excel-Tabellen sind für Reporter schrecklich kompliziert. Dagegen freuen wir uns immer über E-Mails, denn die sprechen.

Vanessa Wormer ist 30 Jahre alt und Datenjournalistin im Investigativressort der SZ. Für die Projekte „Panama Papers“ und „Paradise Papers“ war sie die Datenchefin – und so zusammen mit den Reportern Frederik Obermaier und Bastian Obermayer die Erste, die sich das Material angeschaut hat. Bei solchen Leaks, erklärt sie, gibt es schöne und weniger schöne Daten. „Excel-Tabellen sind für Reporter schrecklich kompliziert auszuwerten. Dagegen freuen wir uns immer über E-Mails, denn E-Mails sprechen, daraus kann man für die Recherche viel ableiten.“

Wie die Daten zu ihr gekommen sind, darüber verrät sie nichts. Die SZ schweigt sich aus über die Quellen sowie über alle Informationen, die Rückschlüsse zulassen würden. Die Kanzlei Appelby auf den Bermuda-Inseln, die im Zentrum der jüngsten Enthüllung steht, behauptet, dass ihr die Daten durch einen Hack entwendet wurden. Aus Quellenschutzgründen lässt die Zeitung bisher auch das unkommentiert.

Ordnung in den Wust bringen

Was Wormer verrät: Irgendwann vor rund einem Jahr begann die Arbeit, mit einem Wust an unstrukturierten Rohdaten auf wenigen Rechnern in der SZ – die wohlgemerkt nicht mit dem Internet verbunden sind.

Und dann? „Der normale Rechercheur würde jetzt die Festplatte an seinen Rechner anschließen und einfach mal gucken, was er da so findet“, sagt Wormer. „Ich hingegen schließe die Daten sofort an unsere Indexierungssoftware an.“

Dieser Text stammt aus der taz.am wochenende. Immer ab Samstag am Kiosk, im eKiosk oder gleich im praktischen Wochenendabo. Und rund um die Uhr bei Facebook und Twitter.

Indexierung muss man sich wie eine automatische Inventur des Materials vorstellen. Die Software – im Fall der SZ heißt sie Nuix und wurde den RechercheurInnen von einem australischen Unternehmen gestiftet – katalogisiert jede einzelne Datei und macht so das gesamte Leak durchsuchbar. Ohne sie müsste man jedes Dokument einzeln öffnen und sichten.

In einem zweiten Schritt werden per optische Zeichenerkennung alle gescannten Dokumente in Textdateien verwandelt – bei den „Panama Papers“ von 2016 hat allein dieser Schritt mehrere Wochen gedauert.

Erst wenn die Indexierung durch ist und die Daten damit komplett durchsuchbar, lässt sich sagen, ob das Material inhaltlich überhaupt etwas taugt. Dafür lässt Wormer die Daten mit einer umfangreichen Promi-Liste abgleichen. Tauchen die Namen von wichtigen Personen aus Politik und Wirtschaft auf? Wenn ja, dann hat man schon fast eine Story.

„Manchmal fällt einem auch abends auf der Couch oder vorm Fernseher ein: Man sollte mal nach dem oder dem suchen. Aber im Grunde versuchen wir eher, Listen abzuarbeiten, um ein Gefühl dafür zu bekommen, was in dem Leak wirklich drinsteckt.“ In diesem Fall war das zum Beispiel die Hamilton-Story. Ein Rennfahrer, ein Jet, eine Urlaubsinsel im Atlantik, das ist Erzählgold.

International werden

Bis hierhin lagen die Daten noch immer ausschließlich beim fünfköpfigen Team von SZ-Investigativ. Erst als klar war, dass es um internationale Konzerne gehen würde, übernahm das ICIJ, das die internationalen Partner kontaktierte.

Ab da würden 380 JournalistInnen aus 67 Ländern mit der Auswertung und Recherche beschäftigt sein. Auf mehreren Treffen stimmten sich die Partner ab: Wer sollte welcher Spur folgen, wer hat welche Expertise, welche Geschichte ist für welches Land von besonderem Interesse? Weitere Dokumente mussten beigebracht werden, um die Daten aus dem Leak zu verifizieren, ProtagonistInnen ausfindig gemacht, ExpertInnen kontaktiert.

„Man muss verstehen: Ein großer Teil der Recherche findet überhaupt nicht in den Daten statt. Es kommt zwar vor, dass etwa E-Mails schon so sprechend sind, dass man direkt daran die Geschichte erzählen kann, aber das ist eher ein Einzelfall.“

Meistens gibt es Hinweise auf Personen und ihre Verbindungen zu bestimmten Firmen, aber keine fertigen Storys. So soll es etwa bei der Geschichte um den verstorbenen Unternehmer Curt Engelhorn gewesen sein, hinter der die SZ „eines der größten deutschen Steuerstrafverfahren in der Geschichte der Bundesrepublik“ vermutet. Engelhorn hatte vor seinem Tod durch Schenkungen an seine Töchter Steuern in Millionenhöhe hinterzogen – so viel war schon seit 2013 bekannt. Die „Paradise Papers“ legen nun nahe, dass die Familie Engelhorn noch über wesentlich mehr ausländische Briefkastenfirmen verfügt, als den ErmittlerInnen damals bekannt war. Wie aber die Familienverhältnisse bei den Engelhorns genau aussehen, das stand nicht im Datenleak. Das mussten die Reporter über klassische Recherchewege herausfinden: Anrufen, hinfahren, Akten durchwühlen.

Während also 380 JournalistInnen in 67 Ländern Datensätze durchsuchen, dürfen gleichzeitig keine Informationen nach außen dringen, damit der Scoop nicht zu früh an die Öffentlichkeit kommt. „Das ICIJ legt großen Wert auf Geheimhaltung“, sagt Wormer. „Die wählen sich ihre Partner bewusst danach aus, wer vertrauenswürdig ist. Wer dieses Vertrauen bricht, setzt aufs Spiel, dass er das nächste Mal nicht mitrecherchieren darf.“ Deswegen kommunizieren die Beteiligten über eine eigens eingerichtete und besonders gesicherte Plattform und verraten nichts über ihre Arbeit – nicht mal in der eigenen Redaktion.

„Außerhalb des Teams sprechen wir grundsätzlich nicht über die Inhalte unserer Arbeit. So kommen wir gar nicht erst in die Situation, zu viel zu verraten“, sagt Wormer. Das heißt, kein Plausch im Flur oder beim Mittagessen über das Projekt, auch nicht, wenn die KollegInnen bohren.

„Wir versuchen in der Regel so zu tun, als wäre das, was wir machen, megalangweilig.“

Trotzdem, irgendwann fängt der Kreis der Mitwissenden an sich zu vergrößern. Alle beteiligten Teams müssen ihre jeweilige IT informieren, die Entwicklungsabteilung, die Grafik. Ausspielformate müssen entwickelt werden, Videos, Anima­tio­nen. Und so wusste offenbar auch schon zwei Wochen vor Veröffentlichung ein User in dem Diskussionsforum Reddit über den anstehenden Scoop Bescheid. „Da kommen noch mehr größere Leaks“, schrieb der inzwischen gelöschte User in das Forum. Hätte schiefgehen können. Ist es aber nicht. Wormer findet: „Dass da mal einer angeben will, ist nicht erstaunlich.“

Die große Dramaturgie

Welche Geschichte wann ausgespielt wird, entscheidet das ICIJ. Es koordiniert die Wünsche der einzelnen Partner. Denn es gibt Begehrlichkeiten. Jeder will die für das eigene Publikum besonders relevanten Geschichten möglichst früh ausspielen. „Es kann passieren, dass der Ausspielplan noch fünfmal umgeworfen wird, weil einzelne Partner noch Wünsche anmelden.“

Am Ende lief die Dramaturgie bei den „Paradise Papers“ wie schon bei den „Panama Papers“: International relevante Geschichten wie die über Nike kommen in den großen Aufschlag an Tag eins, eher nationale wie Hamilton an Tag zwei. So wird verhindert, dass die einen Partner den anderen den Rang ablaufen.

In einigen Wochen wird dann das ICIJ – wie auch schon beim letzten Mal – Rohdaten veröffentlichen, damit auch andere Redaktionen oder Initiativen sich dort bedienen können. Allerdings nicht die gesamten 1,4 Terabyte, sondern nur einen kleinen Teil, als Datenbank. Die Originaldokumente bleiben in den Redaktionen – als Quellenschutz.

Einmal zahlen
.

Fehler auf taz.de entdeckt?

Wir freuen uns über eine Mail an fehlerhinweis@taz.de!

Inhaltliches Feedback?

Gerne als Leser*innenkommentar unter dem Text auf taz.de oder über das Kontaktformular.

Bitte registrieren Sie sich und halten Sie sich an unsere Netiquette.

Haben Sie Probleme beim Kommentieren oder Registrieren?

Dann mailen Sie uns bitte an kommune@taz.de.