Das bislang kaum bekannte chinesische Unternehmen DeepSeek jagte am Montag einen Schock durch die Technik-Welt: Kurz nach der Veröffentlichung ihrer Künstlichen Intelligenz DeepSeek-R1 zog diese in verschiedenen Tests mit bekannteren Modellen gleich, und das, obwohl das Unternehmen laut eigenen Angaben in die Entwicklung des Chatbots nur 5,6 Millionen US-Dollar investiert hat. Der Börsenwert einiger Chiphersteller brach daraufhin ein.

Nur eine Woche zuvor hatte der frisch wieder vereidigte US-Präsident Donald Trump das Projekt „Stargate“ angekündigt. Unter diesem Namen sollen ganze 500 Milliarden Dollar in KI-Rechenzentren investiert werden. Getragen wird das Projekt vom KI-Entwickler OpenAI, dem Soft- und Hardware-Hersteller Oracle und dem japanischen Softbank-Konzern. Auch der staatliche KI-Fonds MGX aus Abu Dhabi gehört zu den Gründungsinvestoren. Dass ein Unternehmen, das nur geringe Millionenbeträge für die Entwicklung einer KI ausgegeben haben soll, mit der Konkurrenz mithalten kann, weckt Zweifel an den absurd hohen Summen, mit denen KI-Projekte gerade beziffert werden. Den Milliarden-Ausgaben von OpenAI, Microsoft, Meta und Oracle steht nun ein vergleichsweise winziges Gesamtbudget für die Entwicklung von DeepSeek gegenüber.

Die Aktie des Chipherstellers Nvidia verlor am Montag prompt rund 18 Prozent ihres Wertes an den Märkten, mit 589 Milliarden Dollar der größte Tagesverlust der Börsengeschichte. Den Hochleistungs-Chips des kalifornischen Unternehmens war bislang eine Schlüsselrolle beim Anlernen von KI-Systemen zugeschrieben worden, weswegen für sie strenge Exportbeschränkungen gelten.

Das Modell arbeitet mit „Gedankenketten“

Diese könnten allerdings einen gegenteiligen Effekt erzielt haben. Ohne die Hochleistungschips griff DeepSeek beim Anlernen des Modells auf einen anderen, synthetischeren Ansatz zurück, als es andere Unternehmen tun: Die Entwickler verzichteten laut DeepSeek vollständig darauf, Zwischenschritte vorzugeben oder diese menschlich zu überprüfen. Stattdessen brachte sich die „emergente“ KI während des Trainings selbst bei, ihre eigenen Antworten zu bewerten. Infolgedessen zeigt das Modell beim Lösen von Aufgaben „Gedankenketten“: Es arbeitet langsamer und mit mehr Zwischenschritten als andere Modelle, zeigt Nut­ze­r:in­nen Lösungswege und kann sich eigenständig korrigieren.

Das lässt sie besonders bei Rechen- und Coding-Aufgaben gut abschneiden und könnte neue Anwendungsbereiche erschließen. Gleichzeitig birgt der neue Ansatz Risiken: Einerseits scheint die KI durch die gut nachvollziehbaren Lösungsschritte transparenter. Andererseits erhöht das Fehlen menschlicher Vorgaben schon während des Trainings das Risiko, eine „täuschende“ KI zu entwickeln, die im Hintergrund anders agiert, als sie es vordergründig zeigt. Auch deshalb könnte das Unternehmen sich entschieden haben, den Code des Modells offenzulegen. So können For­sche­r:in­nen und Nut­ze­r:in­nen das Modell untersuchen und gegebenenfalls kopieren. Diesen Ansatz verfolgt etwa auch Mark Zuckerbergs Meta.

Die Trainingsdaten, auf denen das Modell aufbaut, veröffentlichte DeepSeek allerdings nicht. Gerade über diese Trainingsdaten können aber Vorurteile und Voreingenommenheiten in ein Modell eingebaut werden, beispielsweise wenn diese der Zensur unterliegen. Auch direkt scheinen die Antworten der KI von der chinesischen Zensur betroffen zu sein: Nut­ze­r:in­nen teilten Beiträge, in denen sich die KI Antworten verweigerte, so etwa bei Nachfragen zum Tian’anmen-Massaker oder zum chinesischen Präsidenten XI Jinping. Der taz antwortete DeepSeek auf eine Frage zur Unabhängigkeit Taiwans mit einem Hinweis auf die Ein-China-Politik Chinas: „Taiwan ist seit der Antike ein unveräußerlicher Teil Chinas.“