Google: Neue Bilderkennung unterscheidet Personen, Tiere und Dinge

Ein Google-Team hat einen akademischen Wettbewerb gewonnen, bei dem Dinge in alltäglichen Situationen erkannt und lokalisiert werden müssen. Die Google-Erkennung kann dabei sehr genau zwischen Menschen, Tieren und Gegenständen unterscheiden.

Artikel veröffentlicht am ,
Googles Bilderkennung kann zwischen Dingen, Tieren und Menschen unterscheiden.
Googles Bilderkennung kann zwischen Dingen, Tieren und Menschen unterscheiden. (Bild: Google)

Das Team GoogLeNet aus Mitarbeitern von Googles Forschungsabteilung hat die ImageNet Large-Scale Visual Recognition Challenge (ILSCRC) gewonnen. In diesem jährlichen Bilderkennungswettbewerb treten Teams gegeneinander an, um mit Hilfe von Algorithmen und neuronalen Netzwerken Gegenstände in teilweise komplizierten alltäglichen Situationen zu erfassen.

  • Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)
  • Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)
  • Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)
Googles neue Bilderkennung kann recht genau verschiedene Objekte unterscheiden und lokalisieren. (Bild: Google)

Der Wettbewerb besteht aus drei verschiedenen Anforderungen: Klassifizierung, Klassifizierung mit Lokalisation und Erkennung. Die zu erkennenden Situationen sind alltägliche Szenarien mit stellenweise schwer auszumachenden, sich überlagernden Personen, Tieren und Gegenständen.

Neuronales Netzwerk kann Objekte unterscheiden

Das Google-Team schaffte es hier mit Hilfe eines neuronalen Netzwerks am zuverlässigsten, die verschiedenen Objekte zu unterscheiden. Dies wird anhand der Beispielbilder deutlich: Ein Bild stellt ein Wohnzimmer mit Fernseher, Bücherregal und Katzen dar - alle Gegenstände werden erkannt. Ein zweites Bild zeigt einen Reiter auf einem springenden Pferd; auch hier schafft es der Google-Algorithmus, alle Gegenstände korrekt zu benennen und zu lokalisieren. In einer Verkehrssituation werden andere Autos und einzelne Ampellichter korrekt erkannt.

Anhand des Verkehrsbeispiels wird ein möglicher Anwendungszweck der Google-Erkennung deutlich: Googles selbstfahrende Autos könnten den Algorithmus nutzen, um Verkehrssituationen zu erkennen und einschätzen zu können. Laut Googles Forschungs-Blog liegen weitere Einsatzzwecke in den Bereichen Foto- und Bildersuche sowie bei Youtube.

Das Google-Team baute bei seinem Modell auf verschiedenen Arbeiten anderer Wissenschaftler auf. Eine genaue Beschreibung der technischen Hintergründe findet sich in Googles Forschungs-Blog. Hier finden sich auch Links zu den zugrunde liegenden wissenschaftlichen Arbeiten.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
SU7
Xiaomi stellt elektrische Sportlimousine für 28.000 Euro vor

Xiaomi positioniert sein Elektroauto SU7 gegen das Tesla Model 3 und heizt den Preiskampf auf dem chinesischen Automarkt weiter an.

SU7: Xiaomi stellt elektrische Sportlimousine für 28.000 Euro vor
Artikel
  1. 20 Jahre Far Cry: Das deutsche Grafikwunder
    20 Jahre Far Cry
    Das deutsche Grafikwunder

    Mit Far Cry feierte der deutsche Entwickler Crytek 2004 ein viel beachtetes Debüt. Kann der Südsee-Shooter auch 20 Jahre später noch beeindrucken?
    Von Benedikt Plass-Fleßenkämper

  2. Stern FS Tau B: Hubble entdeckt möglichen neugeborenen Stern
    Stern FS Tau B
    Hubble entdeckt möglichen neugeborenen Stern

    Das Weltraumteleskop Hubble hat einen Teil der Taurus-Auriga-Region untersucht und dabei einen kräftigen Jet entdeckt, der aus einer Hülle aus Gas und Staub ausbricht: Ein neugeborener Stern kündigt sich damit im Weltall an.

  3. Softwareentwicklung: Events und APIs mit DDD entwerfen
    Softwareentwicklung
    Events und APIs mit DDD entwerfen

    Anforderungen an Software ändern sich schneller als je zuvor. Damit Entwickler da mitkommen, sollten sie Domain-driven Design nutzen. Wie das geht, zeigen wir an einem Beispiel.
    Von Annegret Junker

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Prime: Filme leihen für 0,99€ • Super Sale bei Alternate • MindStar: CHERRY Xtrfy MZ1 RGB Wireless 79€ • Alternate: Corsair RM750x/RM850x 109,90€/124,90€, ADATA 64 GB DDR5-6000 206,89€, Bosch-Professional-Werkzeuge • Gratis-Zugaben PS5 Slim & Nintendo Switch OLED beim TV-Kauf [Werbung]
    •  /