Student entwickelt KI, die KI erkennt: Entlarvende Logik

6847833 5992716

Student entwickelt KI, die KI erkennt: Entlarvende Logik

Tim Tlok aus Seevetal hat einen Detektor gebaut, der KI-generierte Texte von menschengemachten unterscheiden kann. KI-geplagte Lehrkräfte freuen sich.

26.2.2024 15:00 Uhr

Hat fünf Monate lang fast jeden Tag am KI-Detektor gearbeitet: Tim Tlok Foto: Theresa Moosmann

Von Theresa Moosmann

Osnabrück taz | Haben Sie sich schon mal gefragt, ob der Text, den Sie gerade lesen, von einem Menschen oder von einer KI geschrieben wurde? Seit einigen Jahren sind sogenannte Large Language Models (LLM) immer erfolgreicher darin, menschengemachte Texte zu imitieren. Das bekannteste LLM ist ChatGPT.

Das menschliche Auge kann kaum noch unterscheiden, ob ein Text menschlich ist oder nicht. Deshalb wird parallel an sogenannten KI-Detektoren geforscht. Also an künstlicher Intelligenz, die künstliche Intelligenz überführt. Der Student Tim Tlok hat im Rahmen seiner Masterarbeit an der Fachhochschule Wedel einen solchen KI-Detektor gebaut, der mit deutschsprachigen Texten trainiert wurde.

Als Tlok Ende 2022 ein Thema für seine Masterarbeit suchte, fiel ihm auf, dass KI-Detektoren nur im englischsprachigen Raum erforscht sind. „Das ist ein Problem, denn LLM können in nahezu jeder Sprache Texte generieren, aber Detektoren nur englische KI-Texte zuverlässig entlarven“, sagt Tlok.

Dass niemand zuvor einen Detektor für deutschsprachige KI-Texte gebaut hat, versteht Tlok selbst nicht. Wahrscheinlich liege es daran, dass man die Daten, mit denen man den Detektor trainiert, selbst zusammenstellen und erzeugen muss, glaubt der 25-Jährige. Er trainierte seinen Detektor mit jeweils 70.000 KI-generierten und menschlich gemachten Texten.

Zuverlässigkeit von 98 Prozent

Für die menschlich gemachten Texte nutzte er öffentlich zugängliche wissenschaftliche Datenbanken von Hochschulen, Reddit-Einträge, Tweets und frei zugängliche Zeitungsartikel. Er achtete darauf, dass die Texte verschiedene Längen hatten und aus verschiedenen Genres stammten, also zum Teil spontan, zum Teil intensiv redigiert veröffentlicht wurden, um eine möglichst breite Datenbasis zu haben.

Für die KI-generierten Texte schrieb er acht Anweisungsvorlagen für ChatGPT, zum Beispiel: „Schreibe mir einen Zeitungsartikel zum Thema X“ oder: „Schreibe mir einen besonders menschlich wirkenden Tweet“. Diese Vorlagen führte sein Computer aus, dafür lief er Tag um Nacht. „Meiner Stromrechnung geht es zum Glück trotzdem gut“, sagt Tlok und lacht.

Ab und zu ging er zum Sport oder traf Freunde, aber fünf Monate lang gab es für ihn nur die Arbeit am Detektor. Sieben Tage die Woche saß er am PC in seiner Wohnung in Seevetal in Niedersachsen. „Ich bin schon sehr ehrgeizig“, sagt er und schmunzelt. Auch seine Mutter sei sehr stolz gewesen, als es im September plötzlich auf das Masterzeugnis auch noch einen Innovationspreis obendrauf gab.

Der Detektor hat nach Angaben der Hochschule eine Zuverlässigkeit von 98 Prozent, das stimmt Tlok zuversichtlich. „In meinen Augen wird es immer möglich sein, KI-generierte Texte zu erkennen“, sagt er. Die Funktionsweise ist sehr durchschaubar. Vereinfacht gesagt ist die Logik von LLM, dass immer das wahrscheinlichste Wort an das vorangegangene angereiht wird. Selbst bei vermeintlich berechenbaren Texten wie Nachrichtenmeldungen hat sein Detektor gute Erfolgsquoten. „Wir Menschen sprechen mit unwahrscheinlicheren Worten, als uns bewusst ist“, sagt er.

Mit seinem Detektor macht Tlok sich jetzt selbstständig, denn das Interesse ist groß. „Ich treffe da einen Nerv der Zeit“, sagt er. Hochschulen wollen prüfen, ob Studierende ihre Hausarbeiten selbst schreiben. Plagiatsprüfer*innen wollen ihren Service um KI-Prüfung erweitern. Und Berufsschullehrer rufen Tlok an, weil sie überprüfen wollen, ob Schüler*innen ihre Hausaufgaben wirklich selbst gemacht haben.

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen

Themen #Künstliche Intelligenz #Niedersachsen #Sprache #Bildung #Schreiben

Feedback Kommentieren Fehlerhinweis

Mehr zum Thema

Ein KI-generiertes Bild von Kindern, die auf einen grünen Kasten schauen

Das Ende einer KI-Kolumne

Hinterher sind wir alle klüger

Die taz und KI-Kolumnist*in Anic T. Wae gehen fortan getrennte Wege. Hier kommen fünf Dinge, die Anics Schöpfer durch sie gelernt haben.

Von Robert Salzer, Roland Fischer, Marie Kilg, Lukas Graw, Theresa Körner und Philipp Meier

Menschen jubeln und klatschen an der Wall Street

Börsengang von Reddit

Ist das noch Nische?

Schon Jahre vor dem Börsengang mischte das Online-Forum Reddit die Weltmärkte auf. Nun gibt es selbst Aktien aus – zum Ärger vieler Nutzer.

Von Klaudia Lagozinski

Studierende sonnen sich im Schloßgarten vor einem historischen Gebäude der Universität Osnabrück.

Künstliche Intelligenz an Hochschulen

Zauberwort und Risiko

Die Hochschulen beschäftigen sich zunehmend mit künstlicher Intelligenz. Das führte zu Euphorie – und der Sorge, durch KI das Lernen zu verlernen.

Von Harff-Peter Schönherr

taz Wahlabo 10 Wochen für 10 Euro

taz digital + wochentaz print testen

Was außer warm anziehen hilft, steht bei uns: Jede Woche mit Schwerpunktthema und auf täglichen Sonderseiten zur heißen Phase des Wahlkampfs.

Jetzt bestellen

4 Kommentare

P
perebor

27.02.2024, 10:30 Uhr

Funktioniert ungefähr zwei Wochen. Dann trainiert irgendjemand eine KI mit seinem Detektor und, schwupps, "weiß" die KI, wie sie seinen Detektor überlisten kann.

Konzeptionell sinnloses Unterfangen mit dem man lediglich zeitlich begrenzt die Unbedarftesten ohne Zugang zu neuer Technologie erwischen wird.

Wird dem Ersteller als Fachmann ja auch bewusst sein.
LH
Lars Hofmann

27.02.2024, 07:33 Uhr

Oben im Text schreibt er seine Masterarbeit. Unten erhält er ein Bachelor-Zeugnis. Was denn nun?
Matt Gekachelt

26.02.2024, 21:46 Uhr

Die KI wird menschliche Texte ersetzen, denn wir gehen gern den bequemsten Weg. Darum brauchen wir solche Detektoren nicht, denn alle Texte werden künstlich sein. Einige vielleicht künstlerisch. Die wären dann aber von Menschen.

Schöpferisch wird keine KI sein können. Etwas neues erfinden, was es noch nie gab, ebenfalls nicht.
T
TheBox

26.02.2024, 16:56 Uhr

Bei allem Respekt für seinen Enthusiasmus - das ist altbekannte Technologie, nur übertragen auf deutsche Sprache, und mir sind mindestens 6 (!) kommerzielle Anbieter äquivalenter Services für deutschsprachige Texte bekannt, die am Start waren, bevor er seine Arbeit abschloss. Ist sicher immer noch eine respektable Masterarbeit, aber wirklich nichts, was einen prominent platzierten Zeitungsartikel rechtfertigen würde, der impliziert, dies wäre ein bedeutender Durchbruch.

meistkommentiert

Interner Zwist bei Springer

Musk spaltet die „Welt“

Nach dem Anschlag von Magdeburg

Wenn Warnungen verhallen

Historiker Traverso über den 7. Oktober

„Ich bin von Deutschland sehr enttäuscht“

Kaputte Untersee-Datenkabel in Ostsee

Marineaufgebot gegen Saboteure

Elon Musk greift Wikipedia an

Zu viel der Fakten

Aufregung um Star des FC Liverpool

Ene, mene, Ökumene