piwik no script img

Software erkennt GeschlechtMänner schreiben anders

Eine neue Software erkennt, ob ein Mann oder eine Frau einen Text verfasst hat. Wer hätte es gedacht: Das Verwenden des Wortes "Bier" ist männlich, "Shopping" dagegen weiblich.

Worüber er wohl gerade schreibt? Wahrscheinlich über Bier, Fußball, Grillen, Technik. Bild: photocase/veynern

Die Antwort kommt innerhalb von Sekundenbruchteilen: "Der Text ist mit einer Wahrscheinlichkeit von 80 Prozent von einem Mann verfasst worden." Genderanalyzer heißt das neueste Spielzeug der Webgemeinde. Nach Software, die einen Text mit dem Schreibstil berühmter Autoren vergleicht, war es eigentlich nur noch eine Frage der Zeit, bis ein Programmierer das entwickelt, was die Nutzer seit rund drei Wochen auf der gleichnamigen Seite (www.genderanalyzer.com) ausprobieren können: ein Programm, das Texte auf Webseiten auf das Geschlecht ihrer Autoren untersucht.

"Wir waren eigentlich nur neugierig und wollten wissen, ob das klappt", sagt Programmierer Jon Kågström. Doch als die drei Schweden begannen, ihre Software an mehreren tausend Blogs zu trainieren, stellten sie fest, dass die Texte von Männern und Frauen sich tatsächlich unterscheiden. "Frauen nutzen ihr Blog eher als Tagebuch, Männer dagegen schreiben eher über Objekte und Konzepte", sagt Kågström. Zwei Beispiele aus der Praxis: Den Satz "Der Schnee fiel sanft auf die verwelkenden Blumen" ordnet das Programm mit einer Wahrscheinlichkeit von 95,6 Prozent einer Autorin zu, denn er beschreibt eine erlebte Situation mit subjektiven Eindrücken. Den Satz "Es gibt zwei große und wachsende Industrien: das soziale Netzwerken und die Spieleindustrie" hält es dagegen mit einer Wahrscheinlichkeit von 99,8 Prozent für die Formulierung eines männlichen Autors.

"Manchmal lassen sich die Unterschiede auch schon an einzelnen Wörtern festmachen", sagt Kågström. So komme der Begriff "Bier" fast ausschließlich bei Männern vor, während "Shopping" praktisch exklusiv in Texten von Frauen verwendet werde.

Laut Kågström lag die Trefferquote unter Laborbedingungen bei 75 Prozent, in der Praxis pendelt sie sich bei rund 60 Prozent ein. Das liegt unter anderem daran, dass die Kriterien, anhand deren die Software Texte analysiert, natürlich Ausnahmen haben. Es gibt auch Frauen, die über Technik schreiben und ab und an das Wort Bier erwähnen. Dazu kommen die Massen von Texten wie Zeitungsartikel, die formalen Regeln folgen und männliche und weibliche Ausdrucksweisen verschwinden lassen.

Doch die Programmierer bieten auch eine schlüssige Erklärung für ein gern verschwiegenes Phänomen: Warum sind die bekannten und viel besuchten Blogs zumindest im deutschsprachigen von Männern verfasst? Das, so vermutet Kågström, liegt daran, dass sich die Nutzer online informieren wollen. Und Informationen finden sie eher in den Blogs der Männer als in denen der Frauen.

So nett die Textespielerei ist - als Nächstes wollen die Schweden etwas "Nützlicheres" in Angriff nehmen. Ein Spamfilter soll unerwünschten Werbeblogeinträgen den Garaus machen. Denn manchmal, so Kågström, arbeiteten Maschinen einfach besser als Menschen.

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen

0 Kommentare

  • Noch keine Kommentare vorhanden.
    Starten Sie jetzt eine spannende Diskussion!