Digitale Assistenten beim BAMF: Software soll Dialekte erkennen
Mit einer automatisierten Sprachanalyse will die Behörde die Herkunft von Menschen bestimmen. Es gibt Kritik: Sie sei intransparent und fehleranfällig.
BERLIN taz | Das Bundesamt für Migration und Flüchtlinge (BAMF) setzt in Asylverfahren zunehmend technische Hilfsmittel ein. Eines davon ist ein System zur automatisierten Erkennung von Dialekten der Asylbewerber. Laut BAMF legten 2016 nur etwa 40 Prozent der Asylbewerber ein Identifikationsdokument vor. Das kann verschiedene Gründe haben: Oppositionelle erhalten keinen Ausweis oder beantragen ihn nicht aus Angst vor Verfolgung, das Dokument geht auf der Flucht verloren oder es wird absichtlich zurückgelassen, weil die Schutzsuchenden mit einer besseren Chance auf Anerkennung rechnen, wenn sie eine andere als die tatsächliche Herkunft angeben.
Wenn Entscheider des BAMF die Herkunftsangabe Schutzsuchender anzweifeln, können sie seit 1998 eine Überprüfung per Sprach- und Textanalyse in Auftrag geben. Dafür unterhält sich ein Dolmetscher außerhalb der förmlichen Anhörung mit dem Antragsteller „über Alltagssituationen, Bräuche und Sitten, geographische Gegebenheiten, et cetera“, erklärt Stefan von Borstel, Sprecher des Bundesamtes für Migration und Flüchtlinge.
Anhand einer mindestens 30-minütigen Tonaufzeichnung des Gesprächs soll ein externer Sprachgutachter im Anschluss feststellen, ob die Sprachmerkmale zu der angegeben Herkunftsregion passen. Laut Asylgesetz müssen die Asylbewerber vorher über den Zweck der Aufnahme informiert werden. Mehr als 1100 solcher Sprachgutachten hat das BAMF 2016 angefordert, so von Borstel.
Seit April dieses Jahres testet das BAMF eine Software, die diese Aufgabe automatisiert erledigen soll. Anhand von Sprachaufnahmen mit einer Länge von zwei Minuten sollen die Arabisch-Dialekte Ägyptisch, Irakisch, Levantinisch und Golf-Arabisch erkannt werden. Eine Erweiterung um Arabisch-Maghrebinisch und Kurdisch werde derzeit geprüft. Das geht aus der Antwort der Bundesregierung auf eine Kleine Anfrage von Abgeordneten der Linksfraktion im Bundestag hervor. Ab dem 1. April 2018 soll das von der Ausländerbehörde als „Stimmbiometrie“ bezeichnete Verfahren regulär und flächendeckend zur Identitätsfeststellung eingesetzt werden.
Besser als der Mensch?
Als Ergebnis der Sprachanalyse per Computer wird die Erkennungswahrscheinlichkeit des jeweiligen Dialektes als Prozentwert ausgegeben. In dem Antwortschreiben der Bundesregierung heißt es, eine derartige Analyse stelle eine „unabhängige, objektive und skalierbare Methode dar, die angegebene Herkunft grundsätzlich zu überprüfen.“ Professor Elmar Nöth, der an der Universität Erlangen-Nürnberg zu Spracherkennung forscht, stimmt dem grundsätzlich zu: „Eine Software kann so eine Aufgabe besser erfüllen als die meisten Menschen, wenn es genügend Trainingsdaten gibt.“ Nöth sieht die Vorteile der Maschine in deren Unermüdlichkeit und Schnelligkeit. Der Computer könne aber nur Hinweise liefern, die durch Menschen bewertet werden müssten.
Das betont auch das Bundesinnenministerium in der Antwort an die Abgeordneten: Die gewonnen Informationen „dienen als unterstützende Hinweise/Indizien im Aslyverfahren“. Die Entscheidung über deren Relevanz verbleibe in der Hand des zuständigen Entscheiders.
Anke Domscheit-Berg, Mitglied der Linksfraktion im Bundestag, kritisiert den Einsatz der Software im Asylverfahren: „Die Software ist intransparent. Die Bundesregierung verrät nicht, wer die Software herstellt und auf welchem Algorithmus sie beruht. Niemand kann daher nachvollziehen, wie sie zu bestimmten Ergebnissen kommt.“ Auf Nachfrage der taz beim BAMF nach dem Hersteller spricht dessen Sprecher nur von einem „weltweiten Technologieführer“, obwohl ein Staatssekretär bereits im März im Parlament angab, für Tests eine „Lösung des Unternehmens Nuance“, einem US-amerikanischen Softwarehersteller, zu verwenden.
Auch der Berliner Rechtsanwalt Matthias Lehnert, der auf Asyl- und Aufenthaltsrecht spezialisiert ist, hat nicht viel Lob für die Einführung der automatisierten Dialekterkennung übrig. Zwar sei er nicht generell gegen den Einsatz von Software, aber Anwälte müssten deren Entscheidungen kontrollieren und anfechten können. „Der Einfluss von Sprachgutachten auf Asylentscheidungen ist sehr groß“, sagt Lehnert über das bisher übliche Verfahren und bemängelt dessen Intransparenz. Auf Protokollen seien nur Kürzel der Gutachter vermerkt, sodass deren Qualifikation nur schwer nachprüfbar sei. Und bei Gerichtsentscheidungen erschienen sie nur in seltenen Fällen. „Bei der Software sehe ich das Problem, dass die Kontrolle der Mechanismen noch schwieriger ist“, sagt der Anwalt.
Domscheit-Berg sieht noch ein zweites Problem beim Einsatz der automatisierten Sprachanalyse: die Fehlerrate, die von der Bundesregierung derzeit mit 20 Prozent angegeben wird. „Das ist viel zu hoch“, sagt die Bundestagsabgeordnete. Es könne schon prinzipiell nicht sein, dass Software über das Schicksal von Menschen entscheidet. „Ist sie dann noch derart fehleranfällig, sollte man erst recht von ihrem Einsatz absehen“, sagt sie.
Neben der automatisierten Sprachanalyse nutzt das BAMF seit kurzem weitere digitale Assistenten in Asylverfahren. Darunter sind Systeme zur einheitlichen Übertragung von Namen in lateinische Schriftzeichen und zum Auslesen von Smartphones, um den Reiseweg eines Flüchtlings feststellen.
Leser*innenkommentare
Baidarka
Die Software ist ja nur ein Baustein bei der Beurteilung der Glaubwürdigkeit der Schilderungen eines Antragstellers.
wenn man Ihr Beispiel aufgreift, ein Antragssteller oder seine Eltern sind aus einer anderen Gegend zugezogen, wird der Befragte dies in der Schilderung seiner Biografie darlegen.
Eine computergestützte Sprachanalyse ist, wie auch ein von Menschen gemachtes Sprachgutachten, nie alleiniges Beurteilungskriterium. Es ist ein Mosaikstein unter vielen.
wxyz
Die Hauptschwierigkeit der Zukunft wird sicher sein, herauszufinden, welcher Computer über welches Sprachsytheseprogramm welchen Dialekt spricht.
Zwar könnte es dann ein nützlicher Hinweise sein, ab welcher Stelle eine Kommunikation abbricht, weil zufällig benötigte Textbausteine fehlen, doch auch daraus läßt sich wohl nicht auf ein kulturelles Herkunftsgebiet schließen.
Aber noch ist es nicht so weit. Mein Computer hat in manchen Fällen noch Schwierigkeiten damit, mittels einer arabischen Computerperson, die mit der Sprache einer chinesischen Computerperson modifiziert wurde, verständlich genug einen französischen Text vorzulesen.
Soungoula
Was tut man mit jemandem, der gar keinen Dialekt spricht, sondern zuhause standardnahe Umgangssprache gelernt hat?
Oder mit jemandem, der in einem Krisengebiet lebt bzw. verfolgt wurde, aber dessen Eltern in früheren Zeiten zugezogen sind und daher einen anderen Dialekt sprechen, den sie an ihr Kind weitergegeben haben?
Der gesamte Denkfehler bei diesem vermeintlich so objektiven Instrument liegt in der Annahme, Dialekte, Sprachen und Sprecher*innen seien einheitlich und ortsfest. Menschen sind mobil, ebenso ihre Sprachen. Im Laufe des Lebens wandelt sich auch die Sprachnutzung des/der Einzelnen.
Sprachen und Dialekte überschreiten Grenzen. Woher weiß die Software, ob jemand aus einem sicheren Land kommt oder 10km weiter aus einem anderen Land, wo ein Gewaltregime herrscht, aber noch derselbe Dialekt gesprochen wird? Politische Grenzen sind absolut und scharf gezogen, sprachliche nicht.
Mit der Software verlässt man sich auf eine Regelhaftigkeit, die es nie gegeben hat. Jenseits der Frage nach der Treffsicherheit der Software ist es schlichtweg unmöglich anhand der Sprache ausreichend klar zu bestimmen, welchen Lebensweg jemand hinter sich hat.
Hat man eigentlich bei der Einführung von diesem "Hilfsmittel" in irgendeinem Schritt mal jemanden aus der Sprachwissenschaft zurate gezogen?
849 (Profil gelöscht)
Gast
@Soungoula Garantiert sitzen da jede Menge Computerlinguisten an den Tastaturen und klimpern. Aber, wie Sie ganz richtig anmerken: Gedanken scheint man sich entweder weniger gemacht zu haben oder man nimmt die Fehler halt in Kauf.
Sven Günther
Wie hoch ist die Fehlerquote denn bei menschlicher Auswertung? Zum einordnen wäre das wichtig.
R R
Die Software möchte ich sehen, die fehlerfrei wäre - gerade im Bereich Mustererkennung.
A. Müllermilch
@R R Spracherkennung von Nuance - Dragon Dictate - gibt es seit ca. 20 Jahren. Die Erkennungsgenauigkeit liegt inzwischen bei 99%, d.h. von 100 diktierten Wörtern werden mindestens 99 richtig verstanden und geschrieben. Um das zu erreichen müssen regionale sprachliche Eigenarten erfasst und berücksichtigt werden. Dafür hat nuance das knowhow. Die Fehlerquote bei der Dialekterkennung dürfte bei Nuance zwar nicht auf Null gehen, aber an die Fehlerquote bei Auswertung durch einen Dolmetscher herankommen.
849 (Profil gelöscht)
Gast
Ich stelle mir das so vor, dass die Software Nuance eine Menge Laute einprogrammiert bekommen hat, die sie als Varianten (Allophone) eines Phonems identifizieren kann, z.B. erkennt sie ein Zäpfchen- und ein Zungenspitzen-r als das Phonem /r/ und interpretiert es dementsprchend richtig.
Die Software müsste aber nun auch erkennen können, dass ein Spanischsprecher, der z.B. das /r/ assibiliert, also mit einem Zischen - ausspricht, kein Chilene ist, obwohl er es in bestimmten Positionen (so wie im chilenischen Spanisch relativ üblich) so ausspricht. Dazu müsste die Software alle anderen spanischen regionalen Aussprachephänomene kennen und sie auf Ähnlichkeiten mit dem Spanischen des Sprechers abgleichen und dann bei einer bestimmten Zahl von Abweichungen die Hand heben. Ich bezweifle nicht, dass das möglich ist, glaube aber nicht, dass die Software das kann, zumal dann nicht, wenn jemand weiß, wie chilenisches Spanisch funktioniert und dieses imitieren kann.
81331 (Profil gelöscht)
Gast
...und was soll das bitte bringen?
Auch wenn ein bestimmter Dialekt erkannt wird, heisst das noch lange nicht, dass die betreffende Person aus der Gegend kommt, in der dieser Dialekt gesprochen wird.
A. Müllermilch
@81331 (Profil gelöscht) Jemand der Bayerisch spricht, wird in Bayern aufgewachsen sein. Wenn nicht, kann er zumindest erklären wieso er bayerischen Dialekt spricht obwohl er noch nie in Bayern war.
849 (Profil gelöscht)
Gast
Was heißt hier Fehlerrate? Schon mal dran gedacht, dass es für ziemlich viele Menschen mit Erfahrung und Befähigung verdammt einfach ist, einen Dialekt nachzuahmen? Die Software möchte ich sehen, die das herausbekäme.
R R
@849 (Profil gelöscht) Dialekte im Arabischen sind deutlich unterschiedlicher als im Deutschen.
849 (Profil gelöscht)
Gast
@R R Ist mir bekannt, ändert aber nichts daran, dass man die mit Erfahrung und Befähigung imitieren kann.
A. Müllermilch
@849 (Profil gelöscht) Das Problem ist doch nicht, dass einige Asylbewerber durch Täuschung zu Unrecht einen bestimmten für sie günstigen Status erwerben. Problematisch wäre allenfalls, wenn Asylbewerber zu Unrecht einen für sie ungünstigen Status bekommen.
849 (Profil gelöscht)
Gast
@A. Müllermilch Na, ich denke, der Staat würde es schon als Problem sehen, wenn einige Asylbewerber sich einen günstigen Status erschleichen würden.
4845 (Profil gelöscht)
Gast
@849 (Profil gelöscht) Also ich kann die arabischen Dialekte nicht beurteilen, aber ich schätze es gibt eher weniger sprachbegabte Menschen die einen Dialekt hunderprotzent nachahmen können so dass diese als Muttersprachler durchgehen. Wenn ich mir die deutschen Dialekte ansehe, dann gibt es eine Menge LEute die einen Dialekt parodieren können, aber nur wenige diesen glaubhaft nachzuahmen. Bei dem was im deutschen Fernsehen manhmal als schwäbisch verkauft wird zieht es einem ja die Zehennägel rauf... aber mein bayrisch ist auch miserabel...aber ich versuch es auch erst gar nicht...
849 (Profil gelöscht)
Gast
@4845 (Profil gelöscht) Na, ich denke, sie werden auch nicht als Deutscher erkannt, wenns sie Polnisch reden und nicht als Pole, wenn sie Deutsch reden, oder? Es gibt viele Menschen, die sich sprachlich sehr gut adaptieren können. Manche machen sich das auch hierzulande zunutze: Vor einigen Jahren war ich mit einem Gast in einem italienischen Restaurant, das Portugiesen als Kellner hatte, die Italienisch sprachen. Mag sein, dass einer Software das auffallen würde, aber dafür müsste sie ja in Bezug auf die arabischen Dialekte dahingehend programmiert sein, dass jemand - sagen wir - syrisches Arabisch mit einem marokkanischen Akzent spricht. Sie dürfte indes eher feststellen, dass es syrisches Arabisch ist und den marokkanischen Akzent ignorieren, denn sie ist höchstwahrscheinlich nur dafür ausgelegt, Dialekte zu identifizieren, nicht deren Imitation.