Eine Wiener Forschergruppe bringt Robotern „googeln“ und rĂ€umliche Wahrnehmung bei. © Franck V./unsplash

Maschinen sind bekannt dafĂŒr, mit hoher VerlĂ€sslichkeit genau das zu tun, wofĂŒr sie gebaut wurden. Im Gegensatz zu Menschen sind sie allerdings schnell ĂŒberfordert, wenn QualitĂ€ten wie eigenstĂ€ndiges Denken oder Neugierde gefragt sind. Weltweit arbeitet die Forschung daher daran, die FĂ€higkeiten von Robotern zu erweitern, so auch in Österreich. Eine Gruppe um den Robotiker Markus Vincze von der Technischen UniversitĂ€t Wien hat versucht, Maschinen zu schaffen, die auf unbekannte GegenstĂ€nde reagieren können. In einem vom Wissenschaftsfonds FWF finanzierten Projekt brachte man Robotern bei, Unwissen zu erkennen und sich die fehlenden Informationen aus dem Internet zu holen.

Mensch als Vorbild

„Wir haben uns am Menschen orientiert“, erklĂ€rt Markus Vincze. „Wenn ein Mensch etwas nicht weiß, macht er sich auf die Suche nach Informationen, frĂŒher in BĂŒchern, heute vorwiegend im Internet. Die Idee war, das Gleiche mit Robotern zu machen.“ Roboter können heute schon in Kamerabildern durch Vergleich mit einer internen Datenbank GegenstĂ€nde erkennen, aber mit unbekannten Objekten wussten Maschinen bislang wenig anzufangen. Hier galt es, neue AnsĂ€tze zu entwickeln. Das Stichwort lautet „Deep Learning“ – das Lernen aus großen Datenmengen.

RĂ€umliche Wahrnehmung

„Der erste Schritt zum Erkennen eines Gegenstands ist die Segmentierung“, erklĂ€rt Vincze. Dabei soll zwischen Objekten und ihrem Hintergrund unterschieden werden, etwa einer Kaffeetasse und der Tischplatte, auf der sie steht. „DafĂŒr gibt es Methoden, die fĂŒr allein stehende Objekte gut funktionieren“, so der Forscher. Als NĂ€chstes wolle man wissen, mit welchen Objekten man es zu tun hat. „Das kann bereits schwierig sein, etwa, wenn mehrere GegenstĂ€nde sich nicht genau trennen lassen, weil sie sich zum Teil ĂŒberdecken.“ Wird das Objekt dennoch erkannt, geht es darum, ein 3D-Modell davon anzufertigen, damit der Roboter es etwa greifen und aufheben kann. Genau diese rĂ€umliche Wahrnehmung sei fĂŒr den Menschen sehr natĂŒrlich, fĂŒr Maschinen aber ebenfalls schwierig, sagt Vincze: „Kleine Kinder können das ab dem ersten Lebensjahr, sie nehmen Objekte rĂ€umlich wahr.“ All diese Methoden wurden nun im Rahmen eines dreijĂ€hrigen Grundlagenprojekts mit internationalen Partnern in Robotern implementiert.

Unwissen autonom erkennen

Vinczes Gruppe interessierte sich also fĂŒr die Situation, wenn ein Objekt, etwa die Kaffeetasse auf dem Tisch, nicht erkannt wurde. Zuerst mussten Kriterien gefunden werden, nach der die Maschine entscheidet, ob sie ein Objekt erkannt hat oder nicht. „Der Roboter vergleicht ein Foto des Objekts mit einer Datenbank. Es sind statistische Verfahren, die entscheiden, wie sehr das beobachtete Objekt den Objekten aus der Datenbank Ă€hnelt“, erklĂ€rt Vincze. „Das Ergebnis ist eine Maßzahl. Wenn diese zu gering ist, soll der Roboter ein Bild davon machen und sich im Internet auf die Suche machen.“ Dazu wurden verschiedene Suchalgorithmen verwendet, unter anderem ImageNet und die Standard-Google-Bildersuche. Dann analysierte Vinczes Gruppe, welche Hauptwörter in den Begleittexten am hĂ€ufigsten vorkommen. Um die Ergebnisse zu verbessern, wurde ein Gegen-Check durchgefĂŒhrt: Der gewonnene Begriff wurde erneut im Internet gesucht und die dabei gefundenen Bilder mit dem Bild des unbekannten Gegenstands verglichen. So ließ sich die QualitĂ€t der Suche verbessern.

Prototyp HOBBIT

Diese neuen ZugĂ€nge wurden mit Prototypen getestet. Vinczes Team und internationale Projektpartner in Italien, Frankreich und Großbritannien nutzten fĂŒr die Tests in frĂŒheren Forschungsprojekten entwickelte Roboter, etwa „HOBBIT“, der fĂŒr den Einsatz in Altersheimen konzipiert wurde, wo er etwa verlorene GegenstĂ€nde finden soll. FĂŒr einen Praxistest wurde eine BĂŒro-Umgebung verwendet, wo zehn typische Utensilien auf einem Schreibtisch lagen: Tastatur, Maus, Locher, Klammermaschine, und so weiter. Die Objekte waren dem System alle bekannt. Dann wurde testweise eines der Objekte aus der Datenbank entfernt und der Roboter musste herausfinden, worum es sich handelte.

Kontext macht den Unterschied

Vincze und sein Team untersuchten in diesem Setting, wie sich der Kontext auf den Erfolg beim Erkennen auswirkt. Wird auf einem Tisch etwa hauptsĂ€chlich Geschirr gefunden, so steigt die Wahrscheinlichkeit, dass auch das unbekannte Objekt ĂŒblicherweise in diesem Zusammenhang auftritt. „Die Kontext-Information lĂ€sst sich analysieren und zielfĂŒhrend verwenden, und die Suche einschrĂ€nken“, sagt Vincze. Damit verbessert sich das Ergebnis weiter. Der Forscher betont, dass es sich um ein Grundlagenprojekt handelte. Bis zur wirklichen EigenstĂ€ndigkeit von Robotern sei es aber noch ein weiter Weg: „Der Mensch muss nach wie vor oft eingreifen.“ Bis Roboter eine Ă€hnliche EigenstĂ€ndigkeit wie Menschen entwickeln können, werde es noch Jahrzehnte dauern, prognostiziert Vincze – man arbeite daran.


Zur Person Markus Vincze ist Robotiker und forscht an der Technischen UniversitĂ€t Wien, wo er das Labor „Vision for Robotics“ 1996 grĂŒndete und leitet. Er interessiert sich insbesondere fĂŒr Methoden zur visuellen Wahrnehmung fĂŒr Roboter in realen Umgebungen.


Publikationen

Mohammad Reza Loghmani, Barbara Caputo, Markus Vincze: Recognizing Objects in-the-Wild: Where do we Stand? 2018 IEEE International Conference on Robotics and Automation (ICRA), 2018
Markus Vincze, Markus Bajones, Markus Suchi, Daniel Wolf, Lara Lammer, Astrid Weiss and David Fischinger: User Experience Results of Setting Free a Service Robot for Older Adults at Home, in: Service Robots, edited by Antonio Neves, 2017