„Es ist die Funktion, die am meisten Emotionen weckt“

7608765 6078249

: „Es ist die Funktion, die am meisten Emotionen weckt“

Von dieser Woche an sind alle Texte in unserer App und im ePaper mit KI-synthetisierten Stimmen der Redakteur:innen Doris Akrap und Bernd Pickert zu hören. Cool!

12.4.2025 0:00 Uhr

Zwei, die Ihnen die taz künftig überall und immer vorlesen können Foto: Wolfgang Borrs

Interview Christian Jakob

taz: Warum wird eine künstliche Intelligenz alle taz-Texte mit imitierten Stimmen von zwei tazler:innen vorlesen?

Lena Kaiser: Wir wollen unseren Print-Leserinnen das digitale Lesen näher bringen und mit der Vorlesefunktion einen zusätzlichen Anreiz schaffen. Viele finden es super, sich Artikel vorlesen zu lassen. Das Vorlesen ist auf jeden Fall die App-Funktion, die am meisten Emotionen weckt. Und wir sehen, dass es auch das meistgenutzte Feature ist, schon bisher, mit der deutlich schlechteren Computerstimme, die noch kein Klon einer echten Stimme war.

taz: Doris, Bernd, warum habt ihr eure Stimmen dafür hergegeben?

Doris Akrap: Weltweit ist dieses Vorlese-Feature so erfolgreich, weil niemand noch mehr auf den Bildschirm schauen möchte. Das ist jetzt wie Radio, ein Medium, das seit Jahrzehnten immer wieder totgesagt wird. Und es lebt und lebt und wird immer beliebter. Dieser ganze Podcast-Wahnsinn ist ja nichts anderes als Radio-Machen. Also ich finde das total sinnvoll.

Bernd Pickert: Das Lustigste war, als ich das Leuten erzählt habe, meinten die: „Ach, dann schreibst du gar nicht mehr, sondern liest nur den ganzen Tag Texte vor?“ Aber das erste Mal einen Text, den ich noch nie gelesen habe, von „mir“ vorgelesen zu bekommen, das ist schon erstaunlich. Ein bisschen fühlt man sich ja auch geehrt, wenn man die Audiostimme der taz sein soll. Es ist ein Kanal, den Leute wahrnehmen und gerne benutzen. Wir merken beim taz-Podcast Bundestalk, dass die Zahlen hochgehen. Die Behauptung, es gebe wie bei Tiktok nur noch anderthalb Minuten als maximale Aufmerksamkeitsspanne – das wird dadurch zumindest derzeit ziemlich widerlegt. Wenn das eine Methode ist, wie wir die Inhalte unserer Zeitung besser unter die Leute bringen können, dann bin ich dafür, jede solche Möglichkeit zu nehmen.

taz: War euch die Vorstellung geheuer, eure Stimmen klonen zu lassen?

Doris Akrap: Ich finde es null spooky. Wir wissen ja, zu was Technik in der Lage ist. Jeder Idiot könnte irgendwo auf einer Bühne, auf der ich irgendwas moderiere, meine Stimme aufnehmen und daraus einen Voice-Klon erstellen. Da habe ich es lieber selber in der Hand.

taz: Nun werden auch Texte, die ihr total blöd findet, mit eurer Stimme vorgelesen werden.

Doris Akrap: Da bin ich ganz professionell. Ich bin ja noch nie aus der taz ausgetreten wegen irgendeinem Text. Und wenn ich mal austrete, dann bestimmt nicht, weil irgendwas erschienen ist, was mir nicht passt. Das ist ja Teil der DNA dieses Ladens.

Bernd Pickert: Wenn ich damit ein Problem hätte, dann müsste ich ein Problem damit haben, überhaupt in diesem Laden zu arbeiten. Jeden Tag erscheint ja im Zweifelsfall irgendwas, was ich vielleicht nicht so gut finde oder so richtig doof. Das ist doch nichts anderes. Und, nee, da habe ich wirklich gar kein Problem damit.

Doris Akrap

Co-Ressortleiterin bei taz zwei + medien. Seit 2008 Redakteurin, Autorin und Kolumnistin der taz. Publizistin, Jurorin, Moderatorin, Boardmitglied im PEN Berlin.

taz: Warum habt ihr nicht eine der schon verfügbaren Stimmen genommen, die etwa auf besondere Verständlichkeit optimiert ist?

Lena Kaiser: Es gibt natürlich einen riesigen Pool an guten Standard-Stimmen. Aber es war im Haus klar gewünscht, es mit eigenen Stimmen zu versuchen.

taz: Es gibt bereits Fälle von sogenannten Deepfakes, etwa in der Slowakei. Dabei wurden Stimmen von Journalist:innen für gefakte Gespräche mit Politiker:innen geklont, um Wahlen zu manipulieren. Ist es da das richtige Signal, wenn auch die taz mit geklonten Stimmen hantiert?

Bernd Pickert: Ich bin ja auch einer der Hosts des Bundestalk-Podcasts. Meine Stimme ist fast jede Woche über den digitalen Kanal der taz zu hören, und wer diese Stimme nehmen will, um so was zu machen, der kann das tun. Da müsste man ja wirklich seine Stimme noch nie irgendwo im digitalen Bereich hinterlegt haben.

Bernd Pickert

Seit 1994 Redakteur im Auslandsressort der taz. Spezialgebiete USA, Lateinamerika, Menschenrechte. Seit Juli 2023 im Moderationsteam des taz-Podcasts Bundestalk.

Doris Akrap: Die Technik ist halt da. Eine Stimme zu klonen, die real existiert, und damit Bullshit zu betreiben, da braucht es jetzt nicht eine taz, die sagt: „Nee, machen wir nicht“, weil das geht sowieso.

taz: Habt ihr als Produktentwickler anfangs mit der Entscheidung, Klon-Stimmen einzusetzen, gehadert, Lena?

Lena Kaiser: Nein. Wir lauerten jetzt sozusagen, seitdem wir diese App rausgebracht haben, auf den Moment, in dem die Technik so weit ist, dass wir das auch nutzen können. Wir haben das ja schon vor zwei Jahren umgesetzt mit Amazon Polly. Das ist aber ganz eindeutig als Computerstimme erkennbar. Bei den neuen Stimmen hört man das nicht. Es war klar, dass, wenn wir jetzt vorne mit dabei sein wollen, es genau der richtige Moment ist, das umzusetzen.

Welche Stimme den Text vorliest, ist abwechselnd und zufällig. Sollten Sie dieses Interview digital lesen, versuchen Sie Ihr Glück direkt mit dem Vorlese-Button. Sonst finden Sie die digitale Ausgabe: taz.de/app

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 50.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen

das medienhaus an der friedrichstraße: „Es ist die Funktion, die am meisten Emotionen weckt“

: „Es ist die Funktion, die am meisten Emotionen weckt“