Aufnahmen von Siri und Alexa: Anhören oder abhören
Smarte Geräte schneiden mit, was ihnen gesagt wird, und die Anbieter lassen das transkribieren. Genau das ist der Job unserer Autorin.
Die deutsche Sprache hat viele Feinheiten – ich höre seit zehn Monaten Gesprächsfetzen oder Befehle aus der Spracherkennungssoftware namens Siri von Teilnehmern aus dem deutschen Sprachraum an, nicht ab. Ich sitze jeden Tag in einem Großraumbüro mit Kopfhörern vor dem Computer und höre sehr gut zu. Ist das, was ich höre, nicht verständlich, wird es als solches kategorisiert, gleichermaßen bei zufälligen, fremdsprachigen oder abgehackten Aufnahmen.
Wenn alles okay ist, schaue ich mir an, was die Software, zuständig für die schriftliche Erfassung und Wiedergabe, daraus gemacht hat. Manchmal muss ich die Qualität der Aufnahmen „graden“, also einschätzen und kategorisieren. Anfangs habe ich gefragt, wozu ich das eigentlich mache, darauf konnten mir die Manager allerdings keine Auskunft geben. Irgendwann war klar: Wenn das keine geheimdienstliche Tätigkeit ist (aber wozu?), dann eben Softwareoptimierung. Da braucht man anscheinend authentische Gespräche für die Verschriftlichung.
„Und du musst noch den Code eingeben“, sagt da jemand gut verständlich. Siri schreibt: „Und du muss doch den Kot eingeben.“ Die Lehrerin, die ich ja eigentlich bin, korrigiert also die automatische Transkription und schickt die neue Version ab. Abgesehen davon sorgt so was für einen Kicherer im tristen Alltag.
Nun regen sich also die User auf, weil ihre intimen Gespräche bezihungsweise Kommunikationsfetzen, die sie über Siri absetzen, „ab“gehört werden. Als ich mit dem Job anfing, war ich auch überrascht. Das geht? Aber warum eigentlich nicht? Ich hab keine Ahnung, wer irgendwas gesagt hat, bei mir ist alles strikt anonym. Aber vielleicht irgendwer an anderer Stelle?
Kein Trost möglich
Könnte man den Typen, der anscheinend Frau und Kind hat und nebenbei eine „geile Sau“ bedient, erpressen? Alles Menschliche kommt bei Siri an, im Guten wie im Schlechten, sozusagen. Deswegen wohl bezeichnen Kinder sie oft als ihre beste Freundin. Aber ich kann nichts machen.
Ich kann auch die Pubertierende nicht trösten, weil ihre beste Freundin sie nicht mehr sehen will. Das weinende Kind nicht, weil es „wieder alles falsch falsch gemacht hat“. Die Frau nicht, die irgendjemandem vom Tod der Mama berichtet. Ich kann höchstens auf die „Unverständlich“-Taste drücken, wenn mir der Dirty Talk, den so viele anscheinend gern mal schnell nebenbei losschicken, zu heftig wird.
Und dann wären da noch die, die sich tierisch aufregen und das Softwareprogramm namens Siri anbrüllen, was für eine dämliche Fotze sie eigentlich sei, dass sie so einen Scheiß schreibt. Wenn die wollen, dass das anscheinend als weiblich identifizierte Programm, welches auch für mich älteres Semester überraschenderweise häufig mit “Fotze“ betitelt wird, besser transkribiert, müssen sie dafür sorgen, dass wir „Transcribers“ und „Correctors“ unseren Job behalten. Ich dankenswerterweise in einem sich recht fair verhaltenden Unternehmen am Stadtrand von Barcelona.
Überlegt mal, was ihr wollt
Denn wenn die Maschine, deren Teil Siri ja ist, nicht eine riesige Menge an Daten eingefüttert bekommt, kann sie nicht lernen, dass das phonetisch gleichklingende Kot“ in bestimmten Kontexten graphemisch als „Code“ zu schreiben ist. Künstliche Intelligenz halt. Das findet ihr doch alle so geil!
Und Siri hat es gelernt. Fantastischerweise funktioniert es. Seit einigen Tagen steht da immer ganz perfekt „Code“ wenn jemand das Wort ausspricht! Ich wäre euch also dankbar, wenn ihr zum einen mit dem Fotze-Geschimpfe aufhört und euch zum anderen mal überlegt, was ihr wollt. Entweder überall alles herumplappern können und sich auch noch die „Arbeit des Fingerschreibens“ (User-O-Ton) zu ersparen oder eben nicht.
Ich hab ein (vorerst noch) bezahltes langes Wochenende vor mir, nachdem wir alle bis auf Weiteres nach Hause geschickt wurden, geh jetzt an den Strand und betrinke mich mit ganz viel kühlem Bier und schau aufs blaue Mittelmeer. Nimm das, User im deutschen Sprachraum!
Die Autorin hat in München Deutsch als Fremdsprache studiert und lebt seit 15 Jahren in Barcelona.
taz lesen kann jede:r
Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen
Starten Sie jetzt eine spannende Diskussion!