Künstliche Intelligenz und Ethik: Stimmen aus dem Jenseits
Mit künstlicher Intelligenz klonen Filmstudios Stimmen verstorbener Menschen. Das wirft dringende ethische und gesellschaftspolitische Fragen auf.
Der Koch und Autor Anthony Bourdain war eine Berühmtheit. Er reiste um die Welt, um dem Fernsehpublikum die exotischsten Küchen vorzustellen. In der Sendung „Parts Unknown“ auf CNN probierte er bei einer Familie im Gazastreifen maqluba, ein traditionell palästinensisches Gericht, interviewte einen Oppositionspolitiker in Kambodscha und aß mit Barack Obama in einer Garküche in Hanoi. Bourdain war kein Starkoch à la Jamie Oliver, sondern ein Reiseschriftsteller in bester amerikanischer Tradition, der die Welt kulinarisch erschloss und die große Politik mit der Leichtigkeit eines asiatischen Reisgerichts erklärte. Im Jahr 2018 beging Bourdain in einem Hotelzimmer in Frankreich Suizid.
Empfohlener externer Inhalt
Der Dokumentarfilm „Roadrunner“, der im vergangenen Jahr in die amerikanischen Kinos kam, ist eine Hommage an sein Lebenswerk. An einer Stelle des Films sagt Bourdain: „Du bist erfolgreich. Ich bin erfolgreich. Und ich frage mich: Bist du glücklich?“ Wer das Timbre von Bourdains Raucherstimme im Ohr hat, glaubt tatsächlich den Reisereporter zu hören. Doch der Koch hat diese Sätze nie gesagt. Artikuliert wurden sie von einer künstlichen Intelligenz. Die Software, die mit Stimmmaterial des Verstorbenen trainiert wurde, hat die Sätze aus einer Mail vertont, die Bourdain vor seinem Tod an einen Freund geschickt hat. Dem Publikum wäre dies vermutlich nicht aufgefallen, hätte Regisseur Morgan Neville nicht in der Öffentlichkeit verraten, dass eine KI-Software Bourdains Stimme synthetisiert hat.
In den Filmstudios produzieren sie nicht mehr nur Spezialeffekte, sondern auch Stimmklone. So wurde für die Serie „The Mandalorian“ von Disney+ die Stimme des jungen Mark Hamill synthetisiert. Das Einzige, was man dafür brauchte, war eine KI und Archivmaterial des ersten „Star Wars“-Films „Krieg der Sterne“ aus dem Jahr 1977, wo Hamill den Piloten Luke Skywalker spielt. Das Prinzip: Eine Software zerlegt die Tonspur in einzelne Laute und setzt die Audioschnipsel per Sprachsynthese zu neuen Wörtern zusammen. Mit solchen Effekten kann man Menschen wie Sprechpuppen agieren lassen. Aussehen, Alter, Stimme – das lässt sich am Computer alles modulieren. Digitalstudios haben sogar schon verstorbene Künstler wie Tupac oder Amy Winehouse als Hologramm reanimiert und auf Events auftreten lassen.
Etwas gruselig ist es schon, wenn da plötzlich ein Toter auf der Bühne steht oder Worte verliest, die die Person zu Lebzeiten nie gesagt hat. Die Frage ist: Wer spricht da eigentlich? Der Computer? Ein Mischwesen? Ein Verstorbener aus dem Off? Die künstliche Reproduktion des menschlichen Stimmorgans wirft eine Reihe ethischer Fragen auf: Darf man posthum Schriftstücke mit der Stimme des Verstorbenen vertonen? Braucht es dafür eine Einwilligung zu Lebzeiten? Sind Stimmen von Schauspielern in Filmen Gemeingut? Wie weit darf die Publikumstäuschung gehen?
Zufällig den eigenen Stimmklon entdeckt
In den USA gab es nach dem Kinostart von „Roadrunner“ eine erregte Diskussion über Bourdains Stimmklon. Einige Kommentatoren hoben auf das Erfordernis der Zustimmung ab, weil das ein rechtliches Mittel sei, über sich selbst zu bestimmen – auch über den Tod hinaus.
Das war in der Vergangenheit nicht immer der Fall. So erfuhr die Synchronsprecherin Susan Bennett per Zufall, dass sie die amerikanische Stimme von Apples Sprachassistentin Siri ist – die Frau hatte im Jahr 2005 Texte für eine Firma eingesprochen, deren Rechtsnachfolgerin Spracherkennung an Apple lizenzierte. Auf rechtliche Schritte verzichtete Bennett.
Die israelische Radiomoderatorin Galit Gura-Eini, die hebräische Stimme des Navigationsdiensts Waze, klagte indes gegen Apple, weil sie ohne ihr Einverständnis zur Stimme von Siri wurde. Der Schauspieler Robin Williams, der unter anderem als Sprecher von Dschinni in „Aladdin“ bekannt wurde und 2014 Suizid beging, sorgte schon zu Lebzeiten vor: In seinem Vertrag mit Disney legte er fest, dass die Filmstudios seine Stimme nicht zu Werbezwecken nutzen dürfen.
Ob Bourdain eine ähnliche Vereinbarung getroffen oder etwas in seinem Nachlass geregelt hat, ist nicht bekannt. Filmemacher Neville behauptet, er habe das Einverständnis von dessen Witwe eingeholt. Menschen, die Bourdain gut kannten, sagen aber, dass er es niemals gewollt hätte, seine Stimme einem Computer zu leihen. Der Koch sprach immer von „Authentizität“. Aber was will das schon heißen in einer Zeit, in der man künstliches Fleisch isst und virtuelle Influencer likt? Wo KI-Systeme wie Rembrandt malen und wie Beethoven komponieren? Was ist noch echt, was Fake?
In der Hyperrealität
„Wir haben die reale Welt abgeschafft“, unkte der französische Philosoph Jean Baudrillard in seinem Werk die „Intelligenz des Bösen“. In der Hyperrealität ist das Original von der Kopie nicht mehr unterscheidbar. Es geht hier aber nicht nur um Erkenntnistheorie, sondern auch um ganz grundsätzliche Fragen der digitalen Identität und Transzendenz. Wo zieht man die Grenze zwischen Leben und Tod? Müssen für digitale Klontechniken nicht dieselben Regeln gelten wie für die Reproduktionsmedizin? Sollten biometrische und genetische Daten, die immer mehr Fleisch an das Skelett des digitalen Zwillings bringen, nach dem Tod automatisch gelöscht werden? Müssen Daten nicht auch mal ruhen?
Wohin die digitale Reproduktionstechnik führen kann, zeigt ein Beispiel aus den USA. 2020 haben MIT-Forscher ein Fake-Video produziert, in dem der ehemalige US-Präsident Richard Nixon in einer Rede an die Nation mit gedämpfter Stimme die auf dem Mond zurückgelassenen Raumfahrer Neil Armstrong und Edwin Aldrin als „tapfere Männer“ betrauert. Die Rede („In Event of Moon Disaster“) wurde nie gehalten, sondern nur für den Fall geschrieben, dass die Apollo-11-Mission scheitert.
Da die Mondlandung und anschließende Rückkehr der Astronauten gelangen, schlummerte das Redemanuskript jahrelang im Archiv des Weißen Hauses. Im Rahmen eines Multimediaprojekts wurde das Manuskript mit einem Stimmklon vertont und als Tonspur über das digital rekonstruierte Bildmaterial gelegt. Wären die Lippenbewegungen nicht so pixelig, könnte man das Video für eine historische Quelle halten.
Schon seit einigen Jahren geistern sogenannte Deep Fakes durchs Netz, manipulierte Videos, in denen Gesichter von Prominenten in Pornos montiert oder Lippenbewegungen von Politikern imitiert werden. Die Software ist zum Teil frei im Internet erhältlich. Zwar stiftet die Technik auch Nutzen. So konnte der US-Schauspieler Val Kilmer, der nach einer Rachenkrebserkrankung seine Stimme verlor, seine Sprachfähigkeit durch einen digitalen Stimmklon wiederherstellen. Dennoch: Das Manipulationspotenzial ist gewaltig.
Haltung des Technikglaubens
Filmemacher Neville ficht das nicht an. Er sagt: „Wir können ein Dokumentations-Ethik-Panel später noch machen.“ Das ist ja so eine typische Haltung des Technikglaubens: Wir machen erst mal, über Ethik können wir dann immer noch reden! Dass ein verantwortungsvoller Umgang mit Technik umgekehrt funktioniert, wollen die Sozialingenieure nicht wahrhaben. In ihrem mechanistischen Weltbild ist der Mensch ein digitales Ersatzteillager, dessen Teile man immer wieder neu zusammensetzt.
Doch das Individuum ist mehr als die Summe seiner Daten. Die Stimme ist ein einzigartiges Identitätsmerkmal, sie gehört zu einem wie die Augen oder Papillarleisten. Die Freiheit zu entscheiden, wann man etwas sagt und wann nicht, unterscheidet den Menschen von einem Sprachautomaten, der auf Knopfdruck losplappert. Doch irgendwie scheint es in unserer speicherwütigen und authentizitätsversessenen Gesellschaft ein Bedürfnis zu geben, die verpasste Vergangenheit in der Gegenwart abzuspielen.
In Südkorea hat eine Frau den Geburtstag ihrer verstorbenen Tochter gefeiert, die in der virtuellen Realität als Avatar wiederbelebt wurde. Es sind rührende Szenen, wie die Mutter mit einem Datenhandschuh über das virtuelle Gesicht ihrer Tochter streichelt, als hätte der Tod sie nie zertrennt. Auf der anderen Seite ist es unheimlich, wie die Technik das Leben transzendiert und eine neue verkörperte Wirklichkeit schafft.
Die Frage ist: Wollen wir das? Wollen wir eine Gesellschaft, in der man Tote wie animierte GIFs herunterlädt? Solange es keine Regulierung gibt, werden die Stimmen aus dem Jenseits nicht verstummen.
taz lesen kann jede:r
Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen
meistkommentiert
Exklusiv: RAF-Verdächtiger Garweg
Meldung aus dem Untergrund
Wahlprogramm von CDU und CSU
Der Zeitgeist als Wählerklient
Anschlag auf Magdeburger Weihnachtsmarkt
Vieles deutet auf radikal-islamfeindlichen Hintergrund hin
Keine Konsequenzen für Rechtsbruch
Vor dem Gesetz sind Vermieter gleicher
Anschlag in Magdeburg
Auto rast in eine Menschenmenge auf dem Weihnachtsmarkt
Russische Männer auf TikTok
Bloß nicht zum Vorbild nehmen