DeepMind développe RoboCat, un modèle d'IA adaptatif pour une multitude de tâches robotiques
Google DeepMind a annoncé avoir développé un modèle d'IA, appelé RoboCat, capable de réaliser une variété de tâches sur différents modèles de bras robotiques. Ce qui distingue ce modèle, selon DeepMind, est sa capacité à résoudre et à s'adapter à plusieurs tâches tout en utilisant différents robots dans des situations du monde réel.
Un Modèle Polyvalent et Adaptatif
“Nous démontrons qu'un seul grand modèle peut résoudre un ensemble diversifié de tâches sur plusieurs véritables applications robotiques et peut rapidement s'adapter à de nouvelles tâches et applications”, a déclaré Alex Lee, chercheur chez DeepMind et co-contributeur à l'équipe derrière RoboCat, lors d'une interview par mail avec TechCrunch.
RoboCat s'inspire de Gato, un autre modèle d'IA de DeepMind capable d'analyser et d'agir sur des textes, des images et des événements. RoboCat a été formé sur des images et des données d'actions collectées à la fois en simulation et dans la vie réelle. Les données proviennent d'une combinaison de modèles de contrôle de robots dans des environnements virtuels, d'humains contrôlant des robots et de versions précédentes de RoboCat.
Formation de RoboCat
Pour former RoboCat, les chercheurs de DeepMind ont d'abord recueilli entre 100 et 1 000 démonstrations d'une tâche ou d'un robot utilisant un bras robotique contrôlé par un humain. Par la suite, ils ont affiné RoboCat sur la tâche, créant un modèle "spin-off" spécialisé qui s'est entraîné sur la tâche en moyenne 10 000 fois.
En utilisant à la fois les données générées par les modèles dérivés et les données de démonstration, les chercheurs ont continuellement élargi l'ensemble de données d'entraînement de RoboCat — et formé de nouvelles versions de RoboCat.
La version finale du modèle RoboCat a été formée sur un total de 253 tâches et testée sur un ensemble de 141 variations de ces tâches, à la fois en simulation et dans le monde réel. DeepMind affirme qu'après avoir observé 1 000 démonstrations contrôlées par des humains recueillies sur plusieurs heures, RoboCat a appris à opérer différents bras robotiques.
Alors que RoboCat avait été formé sur quatre types de robots avec des bras à deux branches, le modèle a pu s'adapter à un bras plus complexe avec une pince à trois doigts et deux fois plus d'entrées contrôlables.
Limites et Perspectives
Malgré les performances impressionnantes de RoboCat, il convient de noter que son taux de réussite varie considérablement selon les tâches — de 13 % à 99 % selon les tests de DeepMind. Cela avec 1 000 démonstrations dans les données d'entraînement ; les succès étaient logiquement moins fréquents avec deux fois moins de démonstrations.
Cependant, dans certains scénarios, DeepMind affirme que RoboCat a pu apprendre de nouvelles tâches avec aussi peu que 100 démonstrations.
Alex Lee croit que RoboCat pourrait contribuer à abaisser la barrière à la résolution de nouvelles tâches en robotique. “Fourni avec un nombre limité de démonstrations pour une nouvelle tâche, RoboCat peut être affiné pour les nouvelles tâches et à son tour générer lui-même plus de données pour s'améliorer encore plus”, a-t-il ajouté.
À l'avenir, l'équipe de recherche vise à réduire le nombre de démonstrations nécessaires pour enseigner à RoboCat comment accomplir une nouvelle tâche à moins de 10.
Source : Google DeepMind