: Zahlen lügen nicht, sie verführen
Willkürliche Statistik-Zielwerte wie das 3-Prozent-Stabilitätskriterium provozieren politisches Verhalten, das schlimmer ist als fragwürdige Zahlen-Deutungen
Gestern wurden die neuen Arbeitsmarktzahlen bekannt gegeben. Wie erwartet: Die Zahl der registrierten Arbeitslosen liegt mit knapp unter 5,2 Millionen hoch. Man kann darauf wetten, dass die Politik das alte Spiel spielen wird, älteren Arbeitslosen neue Brücken in den Ruhestand zu bauen, wodurch die Statistik „bereinigt“ wird. Viele sehen darin eine Manipulation der Statistik, der man nicht grundsätzlich trauen kann. Das ist ein Irrtum – nicht die Statistik, sondern die Politik ist das Problem. Für den falschen Verdacht und den wahren Schuldigen gibt es zahlreiche Beispiele.
Nachdem Griechenland bereits massiver Schwindel bei der Statistik über die staatliche Netto-Neuverschuldung nachgewiesen wurde, stehen jetzt auch Italien und Portugal im Verdacht, ihre Neuverschuldung auf mehr als 3 Prozent ihres Bruttoinlandsproduktes getrieben zu haben. Viele werden sagen: Kein Wunder, gilt doch Churchills Satz: „Ich glaube nur der Statistik, die ich selbst gefälscht habe.“ Dieses Verdikt geht aber gleich zweifach an der Sache vorbei.
Zum Ersten: Churchill hat den Satz niemals gesagt, sondern er wurde ihm von Joseph Goebbels in den Mund gelegt, der von britischen Erfolgen ablenken wollte. Hingegen sind Statistiker ungewöhnlich penible und unbestechliche Menschen. Als realistischer Angelsachse hat Churchill sogar das Gegenteil gesagt: „Look at the facts, because the facts look at you.“
Zum Zweiten: Manipulationen von Definitionen sind gar nicht das eigentliche Problem von Statistiken. Das besteht vielmehr darin, dass dann, wenn einfache statistische Zielwerte zum Maßstab der Politik gemacht werden, so die Neuverschuldungsgrenze von 3 Prozent, das Verhalten der Politik und der Wirtschaft sich oft daran trickreich anpasst, sodass das statistische Ziel seine Aussagefähigkeit verliert. Der britische Ökonom und Zentralbankberater Charles Goodhart hat – aufgrund von enttäuschenden Erfahrungen mit nutzlosen Zielen, die Margret Thachter für die Geldpolitik formulieren ließ – die Nutzlosigkeit statistischer Zielwerte sogar zu einem sozialwissenschaftlichen Gesetz erhoben. Manche vergleichen Goodhart’s Law mit Heisenbergs Unschärferelation: Wenn man allzu genau misst, beeinflusst man das Messobjekt.
Die Reform des Stabilitätspaktes, die durch die „massenhafte“ Verfehlung des 3-Prozent-Ziels notwendig wurde, ist eine vergleichsweise harmlose Reaktion auf einen Statistik-Zielwert, da sie für jedermann erkennbar ist. Man sollte deswegen nicht von einer Manipulation sprechen, da die Reform im Grundsatz ökonomisch vernünftig ist. Es gibt bedenklichere Beispiele für Goodhart’s Law.
Erstes Beispiel: Als es für Deutschland im Jahr 1997 galt, die Nettoneuverschuldung unter 3 Prozent zu halten, um die Eintrittskarte in die Eurozone zu lösen, konnte man nahezu lehrbuchreif beobachten, dass statistische Zielwerte die Politik verleiten, trickreiche Umgehungen zu suchen. In Deutschland wurde zur Erreichung der 3-Prozent-Marke nicht plump die Statistik gefälscht (was aufgrund der Unabhängigkeit des Statistischen Bundesamtes auch schlicht und einfach unmöglich ist). Sondern Ende 1997 hat der Bund sein Ausgabenverhalten geändert: Unter anderem einige Beschaffungen wurden auf den Jahresanfang 1998 geschoben, Vermögen verkauft und Arbeitslosengeld später ausgezahlt (was alles völlig legal war), um so die Verschuldung 1997 unter dem 3-Prozent-Maximum zu halten. Formal war alles korrekt, aber es konnte keine Rede davon sein, dass Deutschland seine Verschuldung nachhaltig gesenkt hatte.
Weitere Beispiele: Weltweit sind politische Manipulationen – wie eingangs angesprochen – am Begriff des „registrierten Arbeitslosen“ üblich. So wird den konservativen britischen Regierungen nachgesagt, dass sie den Begriff der Arbeitslosigkeit 50 mal verändert haben, um mit niedrigen Quoten glänzen zu können. Die Internationale Arbeitsorganisation (ILO) und die OECD haben deswegen eine eigene, international standardisierte Methode vorgeschlagen, Erwerbslosigkeit festzustellen. Sie beruht auf Befragungen der Bevölkerung. Im Prinzip sind solche Stichproben-Erhebungen immer etwas ungenau, aber sie sind gegen nationale Definitions-Manipulationen gefeit. Seit diesem Jahr misst das Statistische Bundesamt übrigens mit dieser Methode, die statt 5,2 Millionen Arbeitsloser nur 4 Millionen Erwerbslose ausweist, die tatsächlich nach Arbeit suchen. Die Bundesregierung scheut sich – zu Recht – dies als Erfolg zu feiern. Aber die Entwicklung der Erwerbslosenzahl wird künftig wirtschaftspolitisch aussagekräftiger sein als die uns vertraute Arbeitslosenquote.
Wie statistisch definierte Ziel-Indikatoren auch menschliches Verhalten unbeabsichtigt verändern können, zeigt wiederum Großbritannien. Dort wird neuerdings die Leistung von Lehrern anhand der Leistungen der „Median-Schüler“ in ihren Klassen gemessen. Der Median kennzeichnet den mittleren Wert besser als der uns allen vertraute arithmetische Mittelwert, bei dem im Falle der Schüler alle Leistungen (etwa gemessen in Noten) aufaddiert und durch die Zahl der Schüler dividiert werden. Da alle Leistungen eingehen, ist der Mittelwert empfindlich gegenüber typischerweise besonders fehlerhaft gemessenen sehr schlechten wie sehr guten Leistungen. Der Median ist hingegen eine „robuste“ Messung der mittleren Leistung. Zu seiner Ermittlung werden alle Schülerleistungen der Reihe nach angeordnet (beginnend mit der schlechtesten und endend mit der besten Leistung). Der Median ist jene Leistung, die der genau in der Mitte dieser Reihe liegende Schüler hat. Fehlerhafte Messungen unten und oben beeinflussen den Wert nicht; insofern eine sinnvolle „robuste Statistik“.
Aber was passiert, wenn man die Leistungen eines Lehrers anhand des Medians bewertet: Der Lehrer konzentriert sich auf die in der Mitte liegenden Schüler und er vernachlässigt sowohl die besonders Förderungsbedürftigen wie die besonders Begabten. Eine wahrlich perverse Bestätigung von Goodhart’s Law.
Alles das spricht keineswegs dagegen, dass Politik und Öffentlichkeit sich mit Hilfe empirischer Erhebungen und Statistiken vergewissern, wie Gesellschaften und Volkswirtschaften tatsächlich aussehen. Es ist sogar sinnvoll, dass mit Hilfe empirischer Analysen noch genauer als bislang üblich untersucht wird, wie bestimmte Politiken, wie Hartz IV oder eine neue Schulpolitik, wirken. Dazu reicht es aber nicht aus, dass nur einfache statistische Eckwerte errechnet werden, sondern es muss auf Basis theoretischer Modelle im Detail analysiert werden, wie einzelne Maßnahmen wirken – oder auch nicht. Gute, das heißt von staatlichen Vorgaben unabhängige Evaluationsstudien zu ermöglichen, ist eine zunehmend wichtigere Aufgabe der Politik. Aber Politik und Öffentlichkeit sollten aufhören zu glauben, dass man gründliche Analysen und politische Entscheidungen durch eine Steuerung anhand einfacher statistischer Zielwerte ersetzen könnte. GERT G. WAGNER