Google Move Mirror: Wenn die KI denkt, man sei ein Kung-Fu-Kämpfer
Move Mirror ist eine Demo für maschinelles Lernen mit Posenet, bei der sich Nutzer vor der Webcam bewegen und Bilder anderer Personen mit ähnlicher Pose angezeigt bekommen - darunter Tänzer und Kung-Fu-Kämpfer. Daraus können Nutzer auch animierte GIFs erstellen.
Google experimentiert mit verschiedenen KI-Algorithmen auf Basis seines Frameworks Tensorflow. Daraus ist das im Browser laufende Programm Move Mirror entstanden, welches Personen vor einer Webcam aufnimmt, deren Körperhaltung in Echtzeit analysiert und aus einer Bilddatenbank dazu passende Bilder anzeigt - beispielsweise einen Karateka, Tänzer oder eine Gewichtheberin. Eine Bildsequenz kann dabei zu einem GIF zusammengefügt werden.
Magic Mirror nutzt eine von Google erstellte Datenbank von 80.000 Bildern als Referenz. Im Blogpost wird nicht ganz klar, ob diese sich aus zufällig ausgewählten Motiven von Google Images zusammensetzt. Die Software läuft webbasiert im Browser und benötigt laut Google keine Übermittlung der Webcamaufnahmen an Server. Lediglich die Positionsdaten der aus Bildern errechneten Bones müssen übertragen werden. Google erhält also ein Skelett aus verschiedenen Körperteilen, das mit den Daten in der Datenbank abgeglichen wird und sendet das passende Bild zurück an den Client.
Werbung für Posenet
Die kleine Applikation ist im Prinzip ein Beispiel für Googles Machine-Learning-Modell Posenet und soll dieses für Entwickler interessant machen. Posenet ist in Googles Tensorflow integriert und errechnet aus Bildern die Position von Körperteilen. Ein so erstelltes Skelett setzt sich aus zwölf Ankerpunkten am Körper - vier am Torso und jeweils zwei an Armen und Beinen - und fünf Punkten im Gesicht zusammen: für Ohren, Augen und Nase. Ankerpunkte werden mit einem Confidence Score zwischen 0.0 und 1.0 versehen. Dieser gibt an, wie sicher sich Posenet mit dessen akkurater Position ist. Dazu kommen die X- und Y-Koordinaten der Punkte im Bild.
Die Anwendungsszenarien für solche Algorithmen sind relativ vielseitig, obwohl es momentan eher eine Spielerei als ein produktiv genutztes System ist. So könnte ein Fitnessprogramm die korrekte Körperhaltung in Echtzeit angeben und Verbesserungstipps anbieten. Auch im Game Design könnte das praktisch sein, wenn Animationsteile eines Modells - sogenannte Bones - durch Machine Learning von einer echten Person einfach errechnet werden können, ohne zusätzliche Kleidung anzuziehen.
... PR Aktion Pfui :)) So a Schmarrn