Maschinen lernen, neugierig zu sein
Maschinen sind bekannt dafĂŒr, mit hoher VerlĂ€sslichkeit genau das zu tun, wofĂŒr sie gebaut wurden. Im Gegensatz zu Menschen sind sie allerdings schnell ĂŒberfordert, wenn QualitĂ€ten wie eigenstĂ€ndiges Denken oder Neugierde gefragt sind. Weltweit arbeitet die Forschung daher daran, die FĂ€higkeiten von Robotern zu erweitern, so auch in Ăsterreich. Eine Gruppe um den Robotiker Markus Vincze von der Technischen UniversitĂ€t Wien hat versucht, Maschinen zu schaffen, die auf unbekannte GegenstĂ€nde reagieren können. In einem vom Wissenschaftsfonds FWF finanzierten Projekt brachte man Robotern bei, Unwissen zu erkennen und sich die fehlenden Informationen aus dem Internet zu holen.
Mensch als Vorbild
âWir haben uns am Menschen orientiertâ, erklĂ€rt Markus Vincze. âWenn ein Mensch etwas nicht weiĂ, macht er sich auf die Suche nach Informationen, frĂŒher in BĂŒchern, heute vorwiegend im Internet. Die Idee war, das Gleiche mit Robotern zu machen.â Roboter können heute schon in Kamerabildern durch Vergleich mit einer internen Datenbank GegenstĂ€nde erkennen, aber mit unbekannten Objekten wussten Maschinen bislang wenig anzufangen. Hier galt es, neue AnsĂ€tze zu entwickeln. Das Stichwort lautet âDeep Learningâ â das Lernen aus groĂen Datenmengen.
RĂ€umliche Wahrnehmung
âDer erste Schritt zum Erkennen eines Gegenstands ist die Segmentierungâ, erklĂ€rt Vincze. Dabei soll zwischen Objekten und ihrem Hintergrund unterschieden werden, etwa einer Kaffeetasse und der Tischplatte, auf der sie steht. âDafĂŒr gibt es Methoden, die fĂŒr allein stehende Objekte gut funktionierenâ, so der Forscher. Als NĂ€chstes wolle man wissen, mit welchen Objekten man es zu tun hat. âDas kann bereits schwierig sein, etwa, wenn mehrere GegenstĂ€nde sich nicht genau trennen lassen, weil sie sich zum Teil ĂŒberdecken.â Wird das Objekt dennoch erkannt, geht es darum, ein 3D-Modell davon anzufertigen, damit der Roboter es etwa greifen und aufheben kann. Genau diese rĂ€umliche Wahrnehmung sei fĂŒr den Menschen sehr natĂŒrlich, fĂŒr Maschinen aber ebenfalls schwierig, sagt Vincze: âKleine Kinder können das ab dem ersten Lebensjahr, sie nehmen Objekte rĂ€umlich wahr.â All diese Methoden wurden nun im Rahmen eines dreijĂ€hrigen Grundlagenprojekts mit internationalen Partnern in Robotern implementiert.
Unwissen autonom erkennen
Vinczes Gruppe interessierte sich also fĂŒr die Situation, wenn ein Objekt, etwa die Kaffeetasse auf dem Tisch, nicht erkannt wurde. Zuerst mussten Kriterien gefunden werden, nach der die Maschine entscheidet, ob sie ein Objekt erkannt hat oder nicht. âDer Roboter vergleicht ein Foto des Objekts mit einer Datenbank. Es sind statistische Verfahren, die entscheiden, wie sehr das beobachtete Objekt den Objekten aus der Datenbank Ă€hneltâ, erklĂ€rt Vincze. âDas Ergebnis ist eine MaĂzahl. Wenn diese zu gering ist, soll der Roboter ein Bild davon machen und sich im Internet auf die Suche machen.â Dazu wurden verschiedene Suchalgorithmen verwendet, unter anderem ImageNet und die Standard-Google-Bildersuche. Dann analysierte Vinczes Gruppe, welche Hauptwörter in den Begleittexten am hĂ€ufigsten vorkommen. Um die Ergebnisse zu verbessern, wurde ein Gegen-Check durchgefĂŒhrt: Der gewonnene Begriff wurde erneut im Internet gesucht und die dabei gefundenen Bilder mit dem Bild des unbekannten Gegenstands verglichen. So lieĂ sich die QualitĂ€t der Suche verbessern.
Prototyp HOBBIT
Diese neuen ZugĂ€nge wurden mit Prototypen getestet. Vinczes Team und internationale Projektpartner in Italien, Frankreich und GroĂbritannien nutzten fĂŒr die Tests in frĂŒheren Forschungsprojekten entwickelte Roboter, etwa âHOBBITâ, der fĂŒr den Einsatz in Altersheimen konzipiert wurde, wo er etwa verlorene GegenstĂ€nde finden soll. FĂŒr einen Praxistest wurde eine BĂŒro-Umgebung verwendet, wo zehn typische Utensilien auf einem Schreibtisch lagen: Tastatur, Maus, Locher, Klammermaschine, und so weiter. Die Objekte waren dem System alle bekannt. Dann wurde testweise eines der Objekte aus der Datenbank entfernt und der Roboter musste herausfinden, worum es sich handelte.
Kontext macht den Unterschied
Vincze und sein Team untersuchten in diesem Setting, wie sich der Kontext auf den Erfolg beim Erkennen auswirkt. Wird auf einem Tisch etwa hauptsĂ€chlich Geschirr gefunden, so steigt die Wahrscheinlichkeit, dass auch das unbekannte Objekt ĂŒblicherweise in diesem Zusammenhang auftritt. âDie Kontext-Information lĂ€sst sich analysieren und zielfĂŒhrend verwenden, und die Suche einschrĂ€nkenâ, sagt Vincze. Damit verbessert sich das Ergebnis weiter. Der Forscher betont, dass es sich um ein Grundlagenprojekt handelte. Bis zur wirklichen EigenstĂ€ndigkeit von Robotern sei es aber noch ein weiter Weg: âDer Mensch muss nach wie vor oft eingreifen.â Bis Roboter eine Ă€hnliche EigenstĂ€ndigkeit wie Menschen entwickeln können, werde es noch Jahrzehnte dauern, prognostiziert Vincze â man arbeite daran.
Zur Person Markus Vincze ist Robotiker und forscht an der Technischen UniversitĂ€t Wien, wo er das Labor âVision for Roboticsâ 1996 grĂŒndete und leitet. Er interessiert sich insbesondere fĂŒr Methoden zur visuellen Wahrnehmung fĂŒr Roboter in realen Umgebungen.
Publikationen