Digitale Assistenten beim BAMF: Software soll Dialekte erkennen

Mit einer automatisierten Sprachanalyse will die Behörde die Herkunft von Menschen bestimmen. Es gibt Kritik: Sie sei intransparent und fehleranfällig.

19.12.2017

8:53 Uhr

Aus Berlin

Jonas Schönfelder

Das Bundesamt für Migration und Flüchtlinge (BAMF) setzt in Asylverfahren zunehmend technische Hilfsmittel ein. Eines davon ist ein System zur automatisierten Erkennung von Dialekten der Asylbewerber. Laut BAMF legten 2016 nur etwa 40 Prozent der Asylbewerber ein Identifikationsdokument vor. Das kann verschiedene Gründe haben: Oppositionelle erhalten keinen Ausweis oder beantragen ihn nicht aus Angst vor Verfolgung, das Dokument geht auf der Flucht verloren oder es wird absichtlich zurückgelassen, weil die Schutzsuchenden mit einer besseren Chance auf Anerkennung rechnen, wenn sie eine andere als die tatsächliche Herkunft angeben.

Wenn Entscheider des BAMF die Herkunftsangabe Schutzsuchender anzweifeln, können sie seit 1998 eine Überprüfung per Sprach- und Textanalyse in Auftrag geben. Dafür unterhält sich ein Dolmetscher außerhalb der förmlichen Anhörung mit dem Antragsteller „über Alltagssituationen, Bräuche und Sitten, geographische Gegebenheiten, et cetera“, erklärt Stefan von Borstel, Sprecher des Bundesamtes für Migration und Flüchtlinge.

Anhand einer mindestens 30-minütigen Tonaufzeichnung des Gesprächs soll ein externer Sprachgutachter im Anschluss feststellen, ob die Sprachmerkmale zu der angegeben Herkunftsregion passen. Laut Asylgesetz müssen die Asylbewerber vorher über den Zweck der Aufnahme informiert werden. Mehr als 1100 solcher Sprachgutachten hat das BAMF 2016 angefordert, so von Borstel.

Seit April dieses Jahres testet das BAMF eine Software, die diese Aufgabe automatisiert erledigen soll. Anhand von Sprachaufnahmen mit einer Länge von zwei Minuten sollen die Arabisch-Dialekte Ägyptisch, Irakisch, Levantinisch und Golf-Arabisch erkannt werden. Eine Erweiterung um Arabisch-Maghrebinisch und Kurdisch werde derzeit geprüft. Das geht aus der Antwort der Bundesregierung auf eine Kleine Anfrage von Abgeordneten der Linksfraktion im Bundestag hervor. Ab dem 1. April 2018 soll das von der Ausländerbehörde als „Stimmbiometrie“ bezeichnete Verfahren regulär und flächendeckend zur Identitätsfeststellung eingesetzt werden.

Besser als der Mensch?

Als Ergebnis der Sprachanalyse per Computer wird die Erkennungswahrscheinlichkeit des jeweiligen Dialektes als Prozentwert ausgegeben. In dem Antwortschreiben der Bundesregierung heißt es, eine derartige Analyse stelle eine „unabhängige, objektive und skalierbare Methode dar, die angegebene Herkunft grundsätzlich zu überprüfen.“ Professor Elmar Nöth, der an der Universität Erlangen-Nürnberg zu Spracherkennung forscht, stimmt dem grundsätzlich zu: „Eine Software kann so eine Aufgabe besser erfüllen als die meisten Menschen, wenn es genügend Trainingsdaten gibt.“ Nöth sieht die Vorteile der Maschine in deren Unermüdlichkeit und Schnelligkeit. Der Computer könne aber nur Hinweise liefern, die durch Menschen bewertet werden müssten.

Das betont auch das Bundesinnenministerium in der Antwort an die Abgeordneten: Die gewonnen Informationen „dienen als unterstützende Hinweise/Indizien im Aslyverfahren“. Die Entscheidung über deren Relevanz verbleibe in der Hand des zuständigen Entscheiders.

Anke Domscheit-Berg, Mitglied der Linksfraktion im Bundestag, kritisiert den Einsatz der Software im Asylverfahren: „Die Software ist intransparent. Die Bundesregierung verrät nicht, wer die Software herstellt und auf welchem Algorithmus sie beruht. Niemand kann daher nachvollziehen, wie sie zu bestimmten Ergebnissen kommt.“ Auf Nachfrage der taz beim BAMF nach dem Hersteller spricht dessen Sprecher nur von einem „weltweiten Technologieführer“, obwohl ein Staatssekretär bereits im März im Parlament angab, für Tests eine „Lösung des Unternehmens Nuance“, einem US-amerikanischen Softwarehersteller, zu verwenden.

Auch der Berliner Rechtsanwalt Matthias Lehnert, der auf Asyl- und Aufenthaltsrecht spezialisiert ist, hat nicht viel Lob für die Einführung der automatisierten Dialekterkennung übrig. Zwar sei er nicht generell gegen den Einsatz von Software, aber Anwälte müssten deren Entscheidungen kontrollieren und anfechten können. „Der Einfluss von Sprachgutachten auf Asylentscheidungen ist sehr groß“, sagt Lehnert über das bisher übliche Verfahren und bemängelt dessen Intransparenz. Auf Protokollen seien nur Kürzel der Gutachter vermerkt, sodass deren Qualifikation nur schwer nachprüfbar sei. Und bei Gerichtsentscheidungen erschienen sie nur in seltenen Fällen. „Bei der Software sehe ich das Problem, dass die Kontrolle der Mechanismen noch schwieriger ist“, sagt der Anwalt.

Domscheit-Berg sieht noch ein zweites Problem beim Einsatz der automatisierten Sprachanalyse: die Fehlerrate, die von der Bundesregierung derzeit mit 20 Prozent angegeben wird. „Das ist viel zu hoch“, sagt die Bundestagsabgeordnete. Es könne schon prinzipiell nicht sein, dass Software über das Schicksal von Menschen entscheidet. „Ist sie dann noch derart fehleranfällig, sollte man erst recht von ihrem Einsatz absehen“, sagt sie.

Neben der automatisierten Sprachanalyse nutzt das BAMF seit kurzem weitere digitale Assistenten in Asylverfahren. Darunter sind Systeme zur einheitlichen Übertragung von Namen in lateinische Schriftzeichen und zum Auslesen von Smartphones, um den Reiseweg eines Flüchtlings feststellen.

Die taz gehört zu 100 Prozent ihren Leser:innen und ist damit nicht nur konzernfrei, sondern auch kostenfrei zugänglich. Alle Artikel stellen wir frei zur Verfügung, ohne Paywall. Gerade in diesen Zeiten müssen Einordnungen und Informationen allen zugänglich sein. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass kritischer, unabhängiger Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung für taz zahl ich. Dank Ihnen haben wir nun die 50.000 erreicht. So viele unterstützen freiwillig und regelmäßig. Noch nicht dabei? Werden Sie jetzt Teil der Community! Jetzt unterstützen

Themen

#Migration #Asyl #Bundesamt für Migration und Flüchtlinge (BAMF) #Bundesamt für Migration und Flüchtlinge (BAMF) #Spracherkennung

Feedback Kommentieren Fehlerhinweis

10 Wochen taz + Sachbuch „Autoritäre Rebellion“

Gegen Rechtsruck hilft Linksblick

Zeiten wie diese brauchen Seiten wie diese: unabhängig, konzernfrei und mit klarer Kante gegen Faschismus, Rassismus und Rechtsruck. Teste jetzt die taz und erhalte das neue Buch „Autoritäre Rebellion“ von Rechtsextremismus-Experten Andreas Speit als Prämie.

Das neue Buch „Autoritäre Rebellion“ von Andreas Speit als Prämie
Die wochentaz jeden Samstag frei Haus + digital in der App
Die tägliche taz von Mo-Fr digital in der App
Zusammen für nur 28 Euro

10 Wochen taz + Buch „Autoritäre Rebellion“

Jetzt bestellen

17 Kommentare

B
Baidarka

19.12.2017, 16:51 Uhr

Die Software ist ja nur ein Baustein bei der Beurteilung der Glaubwürdigkeit der Schilderungen eines Antragstellers.

wenn man Ihr Beispiel aufgreift, ein Antragssteller oder seine Eltern sind aus einer anderen Gegend zugezogen, wird der Befragte dies in der Schilderung seiner Biografie darlegen.

Eine computergestützte Sprachanalyse ist, wie auch ein von Menschen gemachtes Sprachgutachten, nie alleiniges Beurteilungskriterium. Es ist ein Mosaikstein unter vielen.
W
wxyz

19.12.2017, 15:35 Uhr

Die Hauptschwierigkeit der Zukunft wird sicher sein, herauszufinden, welcher Computer über welches Sprachsytheseprogramm welchen Dialekt spricht.

Zwar könnte es dann ein nützlicher Hinweise sein, ab welcher Stelle eine Kommunikation abbricht, weil zufällig benötigte Textbausteine fehlen, doch auch daraus läßt sich wohl nicht auf ein kulturelles Herkunftsgebiet schließen.

Aber noch ist es nicht so weit. Mein Computer hat in manchen Fällen noch Schwierigkeiten damit, mittels einer arabischen Computerperson, die mit der Sprache einer chinesischen Computerperson modifiziert wurde, verständlich genug einen französischen Text vorzulesen.
S
Soungoula

19.12.2017, 12:09 Uhr

Was tut man mit jemandem, der gar keinen Dialekt spricht, sondern zuhause standardnahe Umgangssprache gelernt hat?

Oder mit jemandem, der in einem Krisengebiet lebt bzw. verfolgt wurde, aber dessen Eltern in früheren Zeiten zugezogen sind und daher einen anderen Dialekt sprechen, den sie an ihr Kind weitergegeben haben?

Der gesamte Denkfehler bei diesem vermeintlich so objektiven Instrument liegt in der Annahme, Dialekte, Sprachen und Sprecher*innen seien einheitlich und ortsfest. Menschen sind mobil, ebenso ihre Sprachen. Im Laufe des Lebens wandelt sich auch die Sprachnutzung des/der Einzelnen.

Sprachen und Dialekte überschreiten Grenzen. Woher weiß die Software, ob jemand aus einem sicheren Land kommt oder 10km weiter aus einem anderen Land, wo ein Gewaltregime herrscht, aber noch derselbe Dialekt gesprochen wird? Politische Grenzen sind absolut und scharf gezogen, sprachliche nicht.

Mit der Software verlässt man sich auf eine Regelhaftigkeit, die es nie gegeben hat. Jenseits der Frage nach der Treffsicherheit der Software ist es schlichtweg unmöglich anhand der Sprache ausreichend klar zu bestimmen, welchen Lebensweg jemand hinter sich hat.

Hat man eigentlich bei der Einführung von diesem "Hilfsmittel" in irgendeinem Schritt mal jemanden aus der Sprachwissenschaft zurate gezogen?
- 8G
  849 (Profil gelöscht)
  
  19.12.2017, 16:27 Uhr
  
  @Soungoula:
  Garantiert sitzen da jede Menge Computerlinguisten an den Tastaturen und klimpern. Aber, wie Sie ganz richtig anmerken: Gedanken scheint man sich entweder weniger gemacht zu haben oder man nimmt die Fehler halt in Kauf.
Sven Günther

19.12.2017, 10:06 Uhr

Wie hoch ist die Fehlerquote denn bei menschlicher Auswertung? Zum einordnen wäre das wichtig.
RR
R R

19.12.2017, 09:53 Uhr

Die Software möchte ich sehen, die fehlerfrei wäre - gerade im Bereich Mustererkennung.
- R
  rehbrauneAugen
  
  19.12.2017, 11:30 Uhr
  
  @R R:
  Spracherkennung von Nuance - Dragon Dictate - gibt es seit ca. 20 Jahren. Die Erkennungsgenauigkeit liegt inzwischen bei 99%, d.h. von 100 diktierten Wörtern werden mindestens 99 richtig verstanden und geschrieben. Um das zu erreichen müssen regionale sprachliche Eigenarten erfasst und berücksichtigt werden. Dafür hat nuance das knowhow. Die Fehlerquote bei der Dialekterkennung dürfte bei Nuance zwar nicht auf Null gehen, aber an die Fehlerquote bei Auswertung durch einen Dolmetscher herankommen.
8G
849 (Profil gelöscht)

19.12.2017, 09:12 Uhr

Was heißt hier Fehlerrate? Schon mal dran gedacht, dass es für ziemlich viele Menschen mit Erfahrung und Befähigung verdammt einfach ist, einen Dialekt nachzuahmen? Die Software möchte ich sehen, die das herausbekäme.
- RR
  R R
  
  19.12.2017, 09:55 Uhr
  
  @849 (Profil gelöscht):
  Dialekte im Arabischen sind deutlich unterschiedlicher als im Deutschen.
- 4G
  4845 (Profil gelöscht)
  
  19.12.2017, 09:37 Uhr
  
  @849 (Profil gelöscht):
  Also ich kann die arabischen Dialekte nicht beurteilen, aber ich schätze es gibt eher weniger sprachbegabte Menschen die einen Dialekt hunderprotzent nachahmen können so dass diese als Muttersprachler durchgehen. Wenn ich mir die deutschen Dialekte ansehe, dann gibt es eine Menge LEute die einen Dialekt parodieren können, aber nur wenige diesen glaubhaft nachzuahmen. Bei dem was im deutschen Fernsehen manhmal als schwäbisch verkauft wird zieht es einem ja die Zehennägel rauf... aber mein bayrisch ist auch miserabel...aber ich versuch es auch erst gar nicht...