Bilderkennung mit Mathematica: Wenn aus Chewbacca ein Yorkshire Terrier wird

Die Programmiersprache Wolfram - auch Mathematica genannt - kann jetzt Bildinhalte erkennen: Über ein Web-Interface demonstriert Stephen Wolfram die Fähigkeiten des Algorithmus. Stellenweise sind die Ergebnisse noch recht ungenau - aber auf eine durchaus logische Art.

Artikel veröffentlicht am ,
Chewbacca, der Yorkshireterrier
Chewbacca, der Yorkshireterrier (Bild: Screenshot: Golem.de/Disney)

Der Programmierer Stephen Wolfram hat mit dem Image Identification Project einen neuen Web-Service gestartet, der Bildinhalte auf Fotos erkennt. Das Projekt basiert auf dem neuen ImageIdentify-Befehl von Wolfram, der von ihm entwickelten Programmiersprache, die auch als Mathematica bekannt ist.

  • Aus Chewbacca wird dann auch mal ein Yorkshireterrier, kein Wookie. (Screenshot:Golem.de/Disney)
  • Der neue ImageIdentify-Befehl von Mathematica erkennt zahlreiche Objekte auf Fotos korrekt - so wie hier einen Alligator. (Screenshot:Golem.de/Tobias Költzsch)
  • Auch dieser Kanadareiher wird korrekt erkannt. (Screenshot:Golem.de/Tobias Költzsch)
  • Probleme hat die Funktion bei abstrakteren Bildern wie diesem Foto des Yachthafens von Barcelona. (Screenshot:Golem.de/Tobias Költzsch)
Der neue ImageIdentify-Befehl von Mathematica erkennt zahlreiche Objekte auf Fotos korrekt - so wie hier einen Alligator. (Screenshot:Golem.de/Tobias Költzsch)

ImageIdentify erkennt Schlüsselelemente in Fotos - dementsprechend liegen die Stärken des Befehls aktuell eher noch in konkreten Darstellungen von Dingen und weniger in abstrakten Bildern oder Fotos von alltäglichen Situationen. Das können Nutzer leicht selbst nachvollziehen: So erhalten wir beispielsweise bei einem Bild des Yachthafens von Barcelona, auf dem am Rand eine Brücke zu sehen ist, das Ergebnis "Brücke". Die Boote am anderen Rand hingegen werden ignoriert.

Indys Hut und Chewbacca als Yorkshireterrier

Ein Beispiel der Schlüsselelementerkennung gibt Wolfram selbst: Bei einem Porträt von Indiana Jones erkennt das Image Identification Project nur den Hut, nicht aber Indy selbst. Ein witziges Beispiel für die vom Programmierer selbst als "durchaus menschlich" bezeichneten Fehlgriffe bei der Erkennung ist Chewbacca: Der Wookie wird von der Datenbank als Yorkshireterrier identifiziert. Vom Aussehen durchaus naheliegend, in der Sache aber nicht ganz richtig.

Seine Stärken spielt die Funktion bei Tier- und Naturbildern aus. So werden in unseren Tests sowohl Möwen als auch Kanadareiher und Alligatoren zuverlässig erkannt. Falls vorhanden, gibt es weiterführende Informationen zu den Tieren. Auch hier gilt aber: Allgemeine Situationen wie Landschaften sind keine Stärke der Bilderkennung. Auch bei Monumenten ist die Erkennung noch fehlerhaft: Der Eiffelturm wird als Kirche identifiziert.

Ergebnisse können korrigiert werden

Die Ergebnisse können von den Nutzern bewertet und verfeinert beziehungsweise korrigiert werden, indem der richtige Begriff ausgewählt oder neu eingegeben wird. Auf diese Weise soll die Funktion im Laufe der Zeit zuverlässiger werden und mehr erkennen können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Quellcode auf Github
MS-DOS 4.00 ist jetzt Open Source

Nachdem der ehemalige CTO eine alte MS-DOS-Floppy entdeckt hat, veröffentlicht Microsoft ein Stück Betriebssystem-Geschichte.

Quellcode auf Github: MS-DOS 4.00 ist jetzt Open Source
Artikel
  1. Startrampe Set: Lego bietet Milchstraße und Nasa-Rakete Artemis als Bausatz
    Startrampe Set
    Lego bietet Milchstraße und Nasa-Rakete Artemis als Bausatz

    Lego hat zwei neue Sets vorgestellt, die für Weltraumenthusiasten gedacht sind: das Nasa-Artemis-Startrampen-Set und das Milchstraßen-Galaxie-Set.

  2. Tarifrunde: Montag erneut Streiktag bei der Deutschen Telekom
    Tarifrunde
    Montag erneut Streiktag bei der Deutschen Telekom

    Beim letzten Warnstreik bei der Telekom waren 12.500 Beschäftigte beteiligt. Diesmal wird breiter mobilisiert. Die Telekom versucht Schadensbegrenzung.

  3. Auszieh-Apps: Apple entfernt KI-Nudify-Apps aus dem App Store
    Auszieh-Apps
    Apple entfernt KI-Nudify-Apps aus dem App Store

    Apps, die Personen per KI ungefragt digital ausziehen, sind beliebt. Nun entfernt Apple einige dieser Anwendungen aus dem App Store - aber erst nach Hinweisen von Journalisten.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Asus OLED-Monitor zum Tiefstpreis • Gigabyte GeForce RTX 4070 Ti im Sale • MediaMarkt: Asus Gaming-Laptop 999€ statt 1.599€ • Gamesplanet Spring Sale [Werbung]
    •  /