Software erkennt Geschlecht: Männer schreiben anders

Eine neue Software erkennt, ob ein Mann oder eine Frau einen Text verfasst hat. Wer hätte es gedacht: Das Verwenden des Wortes "Bier" ist männlich, "Shopping" dagegen weiblich.

Worüber er wohl gerade schreibt? Wahrscheinlich über Bier, Fußball, Grillen, Technik. Bild: photocase/veynern

Die Antwort kommt innerhalb von Sekundenbruchteilen: "Der Text ist mit einer Wahrscheinlichkeit von 80 Prozent von einem Mann verfasst worden." Genderanalyzer heißt das neueste Spielzeug der Webgemeinde. Nach Software, die einen Text mit dem Schreibstil berühmter Autoren vergleicht, war es eigentlich nur noch eine Frage der Zeit, bis ein Programmierer das entwickelt, was die Nutzer seit rund drei Wochen auf der gleichnamigen Seite (www.genderanalyzer.com) ausprobieren können: ein Programm, das Texte auf Webseiten auf das Geschlecht ihrer Autoren untersucht.

"Wir waren eigentlich nur neugierig und wollten wissen, ob das klappt", sagt Programmierer Jon Kågström. Doch als die drei Schweden begannen, ihre Software an mehreren tausend Blogs zu trainieren, stellten sie fest, dass die Texte von Männern und Frauen sich tatsächlich unterscheiden. "Frauen nutzen ihr Blog eher als Tagebuch, Männer dagegen schreiben eher über Objekte und Konzepte", sagt Kågström. Zwei Beispiele aus der Praxis: Den Satz "Der Schnee fiel sanft auf die verwelkenden Blumen" ordnet das Programm mit einer Wahrscheinlichkeit von 95,6 Prozent einer Autorin zu, denn er beschreibt eine erlebte Situation mit subjektiven Eindrücken. Den Satz "Es gibt zwei große und wachsende Industrien: das soziale Netzwerken und die Spieleindustrie" hält es dagegen mit einer Wahrscheinlichkeit von 99,8 Prozent für die Formulierung eines männlichen Autors.

"Manchmal lassen sich die Unterschiede auch schon an einzelnen Wörtern festmachen", sagt Kågström. So komme der Begriff "Bier" fast ausschließlich bei Männern vor, während "Shopping" praktisch exklusiv in Texten von Frauen verwendet werde.

Laut Kågström lag die Trefferquote unter Laborbedingungen bei 75 Prozent, in der Praxis pendelt sie sich bei rund 60 Prozent ein. Das liegt unter anderem daran, dass die Kriterien, anhand deren die Software Texte analysiert, natürlich Ausnahmen haben. Es gibt auch Frauen, die über Technik schreiben und ab und an das Wort Bier erwähnen. Dazu kommen die Massen von Texten wie Zeitungsartikel, die formalen Regeln folgen und männliche und weibliche Ausdrucksweisen verschwinden lassen.

Doch die Programmierer bieten auch eine schlüssige Erklärung für ein gern verschwiegenes Phänomen: Warum sind die bekannten und viel besuchten Blogs zumindest im deutschsprachigen von Männern verfasst? Das, so vermutet Kågström, liegt daran, dass sich die Nutzer online informieren wollen. Und Informationen finden sie eher in den Blogs der Männer als in denen der Frauen.

So nett die Textespielerei ist - als Nächstes wollen die Schweden etwas "Nützlicheres" in Angriff nehmen. Ein Spamfilter soll unerwünschten Werbeblogeinträgen den Garaus machen. Denn manchmal, so Kågström, arbeiteten Maschinen einfach besser als Menschen.

Einmal zahlen
.

Fehler auf taz.de entdeckt?

Wir freuen uns über eine Mail an fehlerhinweis@taz.de!

Inhaltliches Feedback?

Gerne als Leser*innenkommentar unter dem Text auf taz.de oder über das Kontaktformular.

Bitte registrieren Sie sich und halten Sie sich an unsere Netiquette.

Haben Sie Probleme beim Kommentieren oder Registrieren?

Dann mailen Sie uns bitte an kommune@taz.de.