Algorithmen bei Bilderkennung: Wenn die KI Beine zählt

4559892 5737433

Algorithmen bei Bilderkennung: Wenn die KI Beine zählt

Es gibt Dinge, die können Computer gut, aber Menschen nicht – und umgekehrt. Das kann für Verwirrung sorgen.

11.12.2020 8:37 Uhr

Was macht das Pferd zum Pferd? Foto: Legacy Releasing Corp./imago

W as ist das?“, fragt das Kind und zeigt auf die Abbildung eines Pferdes. „Das ist ein Pferd.“ – „Und warum ist das ein Pferd?“ Tja.

Kaum etwas zeigt das Dilemma von künstlicher Intelligenz so gut wie das Warum-Fragealter. Was macht das Pferd zum Pferd? Vier Beine? Haben Millionen andere Tiere auch. Die Größe? Es gibt Elefanten. Und Ponys. Die braune Farbe? Als würden Pferde nicht in allen Schattierungen und Mustern von Weiß über Braun bis Schwarz existieren. Mähne und Schweif? Schöne Grüße an Zebra und Esel.

Was also macht das Pferd zum Pferd? Klar, bei einem Bild ist es einfach: Ja, Pferd, check. Weniger trivial: Nur anhand einer Bildbeschreibung festzustellen, um welches Tier es sich handelt. Ohne den Namen zu erwähnen selbstverständlich und ohne einfach aufzuzählen, was es alles nicht ist. Da sind sich künstliche und menschliche Intelligenz auf einmal ganz nah.

Das ist sonst eher selten. Es gibt Dinge, die sind für Computer leicht, für die meisten Menschen aber eher nicht. Richtig gut Schach spielen zum Beispiel. Mal eben ausrechnen, was 358.345.739 geteilt durch 45.029 ergibt. In einer Textdatei mit 300 Millionen Buchstaben die Zeichenfolge xsdfjdsl finden. Und es gibt umgekehrt Dinge, die sind für die meisten Menschen leicht, aber für Computer eher nicht. Sprache verstehen. Emotionen in Gesichtern lesen. Oder eben erkennen, was auf einem Foto abgebildet ist.

Nehmen wir an, wir wollen einer KI beibringen, Pferde von Kühen zu unterscheiden. Um brauchbare Ergebnisse zu bekommen, brauchen wir dafür eine vierstellige Anzahl an Bildern, und zwar aussagekräftige und variantenreiche.

Sind die Pferde immer auf der Weide abgebildet, die Kühe aber im Stall, und bekommt der Algorithmus dann ein Bild von einem Pferd im Stall, wird er mit einiger Wahrscheinlichkeit sagen: Das ist eine Kuh. Denn er hat nicht gelernt, Pferde von Kühen zu unterscheiden, sondern Ställe von Weiden. Und wenn die Kühe auf unseren Trainingsbildern immer schwarz-weiß gefleckt sind, die Pferde aber braun, wird der Algorithmus eine braune Kuh mit größerer Wahrscheinlichkeit als Pferd deklarieren.

Wir brauchen also Pferde und Kühe in unterschiedlichen Umgebungen, in verschiedenen Farben und Größen, von vorne, von hinten, im Profil, in unterschiedlicher Belichtung. Und wenn wir dann einen tollen Satz von Trainingsdaten haben, damit unseren Algorithmus füttern, er auf den Testdaten wunderbar performt und wir ihm daraufhin das Bild eines Traktor vorlegen, wird er nicht etwa sagen: „Leute, wollt ihr mich verarschen.“ Sondern so etwas wie: Das ist zu 53 Prozent eine Kuh.

Das nächste Bild von einem Pferd war übrigens eines, auf dem Pippi Langstrumpf ihres gerade in die Luft stemmt. „Warum hebt das Kind das Pferd hoch?“, fragt das Kind. Liebe KI, du hast noch einen langen Weg vor dir.

taz lesen kann jede:r

Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 50.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen

Svenja Bergt

Redakteurin für Wirtschaft und Umwelt

schreibt über vernetzte Welten, digitale Wirtschaft und lange Wörter (Datenschutz-Grundverordnung, Plattformökonomie, Nutzungsbedingungen). Manchmal und wenn es die Saison zulässt, auch über alte Apfelsorten. Bevor sie zur taz kam, hat sie unter anderem für den MDR als Multimedia-Redakteurin gearbeitet. Autorin der Kolumne Digitalozän.

Themen #Wir retten die Welt #Algorithmen #Künstliche Intelligenz

Feedback Kommentieren Fehlerhinweis

Mehr zum Thema

Eine Frau mit Mantel und Mütze steht zwischen zwei Fahrbahnen - auf der unteren fährt ein Auto vorbei

Corona-App im Einsatz

Mantel, Mütze, tanzende Dinosaurier

Kolumne Wir retten die Welt von Svenja Bergt

Unterwegs mit der Corona-App: 20 Minuten im Supermarkt: 29 IDs. Eine Stunde zu Fuß draußen: 273 IDs. Fehlen nur noch ein paar knallbunte Tiere. Oder?

Software überall

Ein Abo für die 60-Grad-Wäsche

Kolumne Wir retten die Welt von Svenja Bergt

Software in der Waschmaschine und am Kaffeeautomaten? Damit lässt sich einiges anstellen. Es stehen rosige Zeiten bevor – für die Industrie.

Ein Roboter untersucht einen Patienten im Krankenbett

Künstliche Intelligenz gegen Pandemie

Wie KI Corona erkennt

Im Kampf gegen die Coronapandemie wird auch auf künstliche Intelligenz gesetzt. So sollen Infizierte anhand der Sprache oder am Husten erkennbar sein.

Von Svenja Bergt

10 Ausgaben für 10 Euro

Die Wochenzeitung mit taz-Blick

Unsere wochentaz bietet jeden Samstag Journalismus, der es nicht allen recht macht und Stimmen, die man woanders nicht hört. Jetzt zehn Wochen lang kennenlernen.

Jeden Samstag als gedruckte Zeitung frei Haus
Zusätzlich digitale Ausgabe inkl. Vorlesefunktion
Mit Zukunftsteil zu Klima, Wissen & Utopien
Mit Regionalteil „Stadtland“ für alles Wichtige zwischen Dorf und Metropole

Mehr erfahren

3 Kommentare

F
Forscher

22.04.2021, 16:30 Uhr

Auf diese Erkenntnis muss irgend jemand bereits vor Jahren gestoßen sein. Der/die hat daraufhin das CAPTCHA erfunden.
N
N.Rolf

12.12.2020, 23:15 Uhr

Solche Kommentare wie in diesem Artikel sind als Kalauer ganz witzig, zeugen aber im Wesentlichen davon, dass die Konzepte hinter KI nicht verstanden wurden. AlphaGo hatte nach 100 und 1000 Partien Schach auch "noch viel zu lernen". Nach vier Stunden Training allerdings war es kompetent genug, das beste Schachprogramm der Welt zu schlagen.

Diese Art von KI-Darstellung beruhigt Menschen, die Angst vor Neuem haben und sich in der schnellen Veränderung der Welt nicht anpassen können. Aber sie ist irreführend.
0G
02881 (Profil gelöscht)

11.12.2020, 15:02 Uhr

Und dann kommen noch die unterschiedlichen Darstellungsformen mit den ihr eigenen Abstraktionen und Lesarten hinzu. Ein Pferd in der Höhlenmalerei, in der Kinderzeichnung, in der Folk Art, als Emblem, im Cartoon...

Natürlich ist die Frage - Magrittes „Ceci n’est pas une pipe.“ läßt grüßen - schon falsch. Das ist auch kein Pferd sondern das Bild eines Pferdes.

meistkommentiert

Arbeitszeit in Deutschland

Faul sein fürs Klima

Verletzter Polizist bei Nakba-Demo

Im Zweifel für Demoverbote

Israelische Militäroffensive

Sinnlos in Gaza

Annektierte Halbinsel Krim

Quelle neuen Unrechts

Trump und Putin am Telefon

Nichts als Floskeln

Missbrauch und Mobbing an Waldorfschulen

Waldorfschulen müssen ihre Kinder besser schützen