Learning Gripper: Robotergreifer lernt mit Ball
Wie kann ein Roboter Äpfel sortieren? Das Unternehmen Festo hat eine Methode gefunden: Ein pneumatisch betriebener Robotergreifer mit vier Fingern lernt selbstständig, diese Aufgabe zu bewältigen.
Hektisch bewegen sich die Finger von zwei robotischen Greifern am Stand des Esslinger Unternehmens Festo auf der Hannover Messe (Halle 15, D07). Scheinbar willkürlich balancieren sie einen schwarzen Ball mit dem Herstellerlogo. Tatsächlich sind die Bewegungen zumindest des eines Greifers zielgerichtet: Mit wenigen Bewegungsabfolgen schafft er es, den Ball so zu positionieren, dass sich der blaue Schriftzug oben befindet.
Learning Gripper heißt der robotische Greifer, der im Rahmen von Festos Bionic Learning Network entwickelt wurde. Der Greifer hat vier Finger, die dem menschlichen Zeigefinger nachgebildet sind: Wie dieser haben auch die Finger des Grippers drei Freiheitsgrade: Der Finger kann vor und zurück sowie nach links und rechts bewegt werden und er kann geknickt werden.
Pneumatische Aktoren
Angetrieben werden die vier Finger von je drei pneumatischen Aktoren. In die Bälge wird Luft mit einem Druck von 2,5 und 3,5 Bar gepumpt. Als Folge verformen sie sich und bewegen so die Finger. Nach einem ähnlichen Prinzip funktioniert auch der bionische Handling Assistent, den Festo 2010 präsentierte. Wie dieser ist auch der Learning Gripper per 3D-Druck hergestellt worden.
Aufgabe des Grippers ist es, den Ball so lange hin- und herzudrehen, bis das Herstellerlogo nach oben zeigt. In dem Ball ist ein Sensor, der die Höhe des Balls über dem Greifer und dessen Ausrichtung erkennt. Zudem ist in der Kuppe eines jeden Fingers ein Kraftsensor, der erfasst, ob der jeweilige Finger Kontakt zum Ball hat.
Der Lernprozess erfolgt nach dem Prinzip von Versuch und Irrtum: Die Finger drehen den Ball zunächst rein zufällig, wobei die Sensorik das Ergebnis erfasst und dem Greifer ein Feedback gibt. Seien die Bewegungen zielführend, erhalte das Systeme eine positive Rückmeldung, erklärt Festo-Mitarbeiter Arne Rost im Gespräch mit Golem.de. Für nicht zielführende Aktionen gebe es entsprechend eine negative Meldung.
Lernen durch Feedback
Zielführend heißt: Die Schrift soll möglichst weit von der Grundfläche des Greifers entfernt sein, je weiter, desto besser und desto positiver die Bewertung. Reinforcement Learning, bestärkendes oder verstärkendes Lernen, heißt diese Methode des Maschinenlernens. Das System bekommt keine Handlung vorgegeben, sondern es lernt anhand seiner eigenen Aktionen und deren Analyse.
Das System lerne also selbstständig, mit einer Umgebung zu interagieren, sagt Rost. Praktisch daran sei, dass sich die Erfahrungen des einen Systems auf ein anderes übertragen ließen: Dieses müsse also nicht selbst den ganzen Lernprozess durchlaufen, sondern übernehme die Algorithmen von dem ersten und passe sie lediglich auf die eigenen Gegebenheiten an.
Äpfel sortieren
Die Idee zu dem System sei durch die Anfrage eines Kunden gekommen, erzählt Rost: Der habe Äpfel automatisch so sortieren wollen, dass sie alle gleich ausgerichtet, mit dem Stiel nach oben im Karton lägen. In so einem Fall übernehme eine Kamera, die das System von oben beobachte, die Aufgabe des Sensors im Ball.
In Hannover zeigt Festo zwei Gripper: Der eine weiß bereits, wie er den Ball drehen muss, um ihn richtig zu positionieren. Der andere Gripper lernt noch. Etwa eine Stunde dauert der Prozess, bis er weiß, wie er richtig mit dem Ball umgeht. Hat er es gelernt, wird er neu gestartet und beginnt wieder von vorn.
Sagen wir es mal anders: Festo ist sich der Öffentlichkeitswirksamkeit der Bionik-Sparte...
Es gibt sich darum dass das Teil 'selber' den Prozess lernt. Der Vorteil ist dass sich...