: Unerwartet aufgetaucht
Mit der chinesischen Firma DeepSeek schafft es plötzlich ein unbekanntes Unternehmen, ganz oben im KI-Markt mitzuspielen. Macht das Hoffnung, dass auch Europa noch nicht abgehängt ist bei der Suche nach der klügsten künstlichen Intelligenz?
Von Raoul Spada
1 Ein chinesisches Start-up veröffentlicht ein neues KI-Modell und alle drehen durch. Was ist da los?
Gleich nach seiner Vereidigung als US-Präsident hatte Donald Trump gigantische Investitionen in künstliche Intelligenz angekündigt: Rechenzentren, Chip-Fabriken, whatever it takes. Regulationen wurden gekippt, mehrere US-Unternehmen, darunter auch die KI-Softwarefirma OpenAI, gelobten, Milliardensummen in das Projekt zu stecken. Das erklärte Ziel: die Ersten zu sein im Wettrennen um die klügste KI.
Ziemlich zeitgleich mit der Ankündigung des Projektes veröffentlichte ein bislang kaum bekanntes chinesisches Unternehmen eine KI mit dem Namen DeepSeek-R1. Nur 5,6 Millionen Dollar soll das Modell nach eigenen Angaben des Start-ups aus Hangzhou gekostet haben. Trotzdem kann es in vergleichenden Tests mit den neuesten Modellen großer Tech-Firmen mithalten.
Damit hat die kleine Firma eine Sensation gelandet. Voriges Jahr hatte Dario Amodei, Chef der KI-Firma Anthropic, die Kosten für das Training einer leistungsfähigen KI noch auf 100 Millionen bis 1 Milliarde Dollar geschätzt. ChatGPT hat nach Angaben des Herstellers OpenAI rund 100 Millionen Dollar gekostet. Die leistungsstärkeren Modelle von OpenAI bekommen Normalsterbliche aktuell gar nicht zu sehen, so etwa das Milliardenprojekt und bislang beste OpenAI-Modell, o1. Mit genau diesem kann es R1 in vielen Tests wohl aufnehmen.
2 Eine offenbar günstige KI schlägt eine teurere. Ist das mehr als ein Grund zur Schadenfreude?
In der Tech-Branche wird gern von Disruption gesprochen, jetzt gab es mal welche. Für die USA war das ein „Sputnik-Moment“, so formulierte es Marc Andreessen, ein Großinvestor und Berater Donald Trumps. Also so wie damals, als die Sowjetunion im Kalten Krieg plötzlich vor den USA einen Satelliten ins All schickte. Alexandr Wang, Chef des KI-Konzern Scale AI, nannte es einen „Wake-up-Call“ für die Vereinigten Staaten. Da kommt ein chinesischer Unternehmer daher, dessen Firma KI nicht einmal als Hauptgeschäft entwickelt, und zieht mit vergleichsweise geringem finanziellen Aufwand gleich. Ist die Überlegenheit der US-amerikanischen Tech-Konzerne also nur eingebildet?
Für die Aktienmärkte war das neue Modell ein Schock, weil es nicht mit Hochleistungschips des kalifornischen Unternehmens Nvidia trainiert wurde. Diese galten für das Training einer konkurrenzfähigen KI bislang als unerlässlich. Aber das chinesische Unternehmen brauchte sie nicht. Kurseinbrüche von Chipherstellern und US-Tech-Firmen folgten, an den Märkten gingen rund 2 Billionen Dollar verloren – unvorstellbare Summen, die in den Marktbewertungen der wertvollsten Unternehmen der Welt in kürzester Zeit entstehen und verschwinden können.
3 Ist der ganze Hype um KI nicht sowieso übertrieben?
Es ist kaum möglich, zwischen falschen Versprechen von Tech-Konzernen und seriösen Potenzialen zu unterscheiden. Aber KI verspricht, unser Verhalten morgen noch besser vorherzusagen als heute. Das tun große Sprachmodelle, die häufigsten KIs, indem sie Regeln und Wahrscheinlichkeiten in großen Datensätzen finden. Aus Milliarden Websites, Kommentaren und anderen Kommunikationen gewinnt ein Sprachmodell in seiner Trainingsphase unzählige statistische Zusammenhänge. Indem es diese Regeln miteinander vergleicht und gegeneinander abwägt, errechnet es Schritt für Schritt immer den nächstwahrscheinlichen Wortbaustein – oder, wenn man eine KI auf Bilddateien trainiert, eben den nächsten Pixel.
Mit genug Prozessorenpower lässt sich einiges errechnen. Flugbahnen von Marschflugkörpern zum Beispiel. Viel Geld steckt darin, Raketen dort einschlagen zu lassen, wo es die Absender wünschen. Darum kamen die ersten wirklich lukrativen Aufträge für die Massenfertigung von Prozessoren vom Militär. Alles bei den Tech-Unternehmen baut auf der Rechenleistung moderner Prozessoren auf.
Mit genug Daten lässt sich zum Beispiel Kaufverhalten errechnen. Die heute so wertvollen Social-Media-Plattformen versprechen Investoren, die dafür notwendigen Daten aus unserem Verhalten zu schürfen. Ganz nebenbei stellen sie auch noch die Infrastruktur für zielgenaue Werbung. Der „Amazon-Algorithmus“, oder in anderen Worten: „Nutzer, die diesen Artikel kauften, kauften auch …“, hat Jeff Bezos zu einem der reichsten Menschen der Welt gemacht. Er ist die Grundlage dafür, unser Verhalten nicht nur vorherzusagen, sondern uns auch immer mehr in Richtung Kasse zu schubsen.
Schon in der Trainingsphase sind KI-Modelle direkt abhängig von der Rechenleistung. Die Gleichung lautete deswegen lange: Die größte Rechenleistung führt zur klügsten KI und die klügste KI gibt sicher auch die wertvollsten Antworten. Darum wollen alle die potentesten Rechenzentren haben (die dann auch sehr viel Strom verbrauchen). Der Automatismus, dass der dickste Rechner die dickste KI hervorbringt, wurde durch DeepSeek wenigstens für kurze Zeit in Frage gestellt.
4Was ist jetzt anders bei diesem neuen chinesischen KI-Modell?
Gerade weil sie auf viele kleine Optimierungen zurückgreifen mussten, konnten die chinesischen Entwickler:innen mehr aus den schwächeren Prozessoren herausholen. Aber vor allem verzichteten sie darauf, der KI in der Trainingsphase Zwischenschritte vorzugeben. Die KI brachte sich so selbst bei, Aufgaben zu zerstückeln und Teilantworten zu evaluieren. Sie „erklärt“ sich in Zwischenschritten selbst, was sie tut und erweckt so den Anschein, als würde sie über ihre Antworten nachdenken. Die gezeigten Lösungswege wirken auf Nutzer:innen vertrauensbildend.
Nur: DeepSeek erschlägt die Fragestellenden auch in Textbergen. Denn die KI, die sich selbst trainieren durfte, hat sich nicht nur beigebracht, ihre Antworten besser zu strukturieren. Sondern auch, immer längere Antworten zu geben.
Nur bei kritischen Nachfragen zur chinesischen Staatsführung fasst sich die KI kurz. Sie weicht aus, gibt regimekonforme Antworten oder verweigert diese gleich. Mit großer Wahrscheinlichkeit unterliegen auch die Trainingsdaten der chinesischen Zensur. Wer etwas in die App eintippt, muss außerdem davon ausgehen, dass die Daten über Server in China geschickt werden. Der Datensatz, mit dem die KI trainiert wurde, ist bisher nicht öffentlich. Aber der DeepSeek-Quellcode liegt offen. Das heißt, dass jede:r das Open-Source-Modell ansehen kann, gegebenenfalls auch kopieren oder verändern. Auch der Chefentwickler von Metas KI „Llama“, Yann LeCun, las den Überraschungserfolg von DeepSeek deswegen als Beleg für die Kraft offener Forschung. Theoretisch könnte jedes Unternehmen, jede Universität und jede:r geschickte Entwickler:in auf DeepSeek aufbauen und so ein eigenes Sprachmodell anlernen.
5 Bedeutet das, dass der Wettlauf mit den groß Tech-Unternehmen auch für Europa noch nicht verloren ist?
In Europa erweckt der Überraschungserfolg mindestens viele Hoffnungen wieder. Selbst wenn große Rechenzentren voraussichtlich weiterhin wichtig sind: Vieles spricht dafür, dass auch ohne monströse Investitionen so einiges möglich ist.
Vieles passiert auch schon. In der EU entstehen Geräte und Bauteile, die bei der Herstellung von Prozessoren verwendet werden. Das niederländische Unternehmen ASML baut auch in Deutschland Fertigungstechnik für integrierte Schaltkreise. In Frankreich haben zuletzt das Unternehmen Mistral und in Deutschland Aleph Alpha leistungsfähige KIs entwickelt.
Allein die Bundesregierung versprach in ihrer KI-Strategie Investitionen von rund fünf Milliarden Euro und verpflichtete sich auf das Ziel einer gemeinwohlorientierten KI-Entwicklung. Gerade an deutsche Universitäten kommt einiges an Entwicklung zusammen. Schon 2020 kam der Digitalverband Bitkom bei einer Erhebung auf fast 2.000 Mitarbeiter:innen an Lehrstühlen deutscher Universitäten, die sich in verschiedensten Anwendungsbereichen mit KI beschäftigen.
Voriges Jahr im August beschloss das EU-Parlament unter dem Namen AI Act außerdem das erste KI-Gesetz weltweit. Es teilt verschiedene Anwendungen in Klassen ein und richtet die Strenge der Regeln nach dem Risiko. Social Scoring, also die Bewertung von Bürger:innen durch KI-Systeme, wie es auch in China schon erprobt wurde, ist grundsätzlich verboten. Überwachungsgegner:innen bemängeln, dass die KI-gestützte Auswertung von Überwachungsvideos weiterhin erlaubt ist. Hochriskante künstliche Intelligenzen genießen weitere Ausnahmen, wenn sie die nationale Sicherheit, den Grenzschutz oder die Strafverfolgung betreffen. Auch bleiben kritische Fragen beim Datenschutz und Urheberrecht ungeklärt.
Bei der Umsetzung in nationales Recht bleibt einer neuen Bundesregierung deswegen noch Gestaltungsspielraum. Deutschland muss eine nationale Behörde einrichten oder die Einhaltung des Rechts durch andere Behörden überprüfen, indem es die Aufgaben etwa an die Bundesnetzagentur oder an die Finanzaufsicht verteilt. Davon hängt einiges ab, auch weil viele Fragen sich erst mit dem Aufkommen immer neuer KI-Modelle offenbaren werden – scheibchenweise. Hype für Hype.
taz lesen kann jede:r
Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen