Vous voulez faire fonctionner les robots plus rapidement ? Essayez de laisser l'IA prendre le contrôle

0
171

Les robots quadrupèdes deviennent un spectacle familier, mais les ingénieurs travaillent toujours sur toutes les capacités de ces machines. Maintenant, un groupe de chercheurs du MIT dit qu'une façon d'améliorer leur fonctionnalité pourrait être d'utiliser l'IA pour aider à apprendre aux bots comment marcher et courir.

Habituellement, lorsque les ingénieurs créent le logiciel qui contrôle le mouvement des robots à pattes, ils écrivent un ensemble de règles sur la façon dont la machine doit répondre à certaines entrées. Ainsi, si les capteurs d'un robot détectent x quantité de force sur la jambe y, il répondra en mettant le moteur a sous tension pour exercer le couple b, et ainsi de suite. Le codage de ces paramètres est compliqué et prend du temps, mais il donne aux chercheurs un contrôle précis et prévisible sur les robots.

L'IA utilise des essais et des erreurs pour développer son propre style d'exécution

Une approche alternative consiste à utiliser l'apprentissage automatique – en particulier, une méthode connue sous le nom d'apprentissage par renforcement qui fonctionne par essais et erreurs. Cela fonctionne en donnant à votre modèle d'IA un objectif connu sous le nom de “fonction de récompense” (par exemple, déplacez-vous aussi vite que vous le pouvez), puis en le laissant libre pour déterminer comment atteindre ce résultat à partir de zéro. Cela prend beaucoup de temps, mais cela aide si vous laissez l'IA expérimenter dans un environnement virtuel où vous pouvez accélérer le temps. C'est pourquoi l'apprentissage par renforcement, ou RL, est un moyen populaire de développer une IA qui joue à des jeux vidéo.

C'est la technique utilisée par les ingénieurs du MIT, créant un nouveau logiciel (appelé “contrôleur”) pour le quadrupède de recherche de l'université, Mini Cheetah. En utilisant l'apprentissage par renforcement, ils ont pu atteindre une nouvelle vitesse de pointe pour le robot de 3,9 m/s, soit environ 8,7 mph. Vous pouvez voir à quoi cela ressemble dans la vidéo ci-dessous :

Comme vous pouvez le voir, la nouvelle démarche de course de Mini Cheetah est un peu disgracieuse. En fait, il ressemble à un chiot en train de gratter pour accélérer sur un plancher en bois. Mais, selon le doctorant du MIT Gabriel Margolis (co-auteur de la recherche avec le post-doctorant Ge Yan), c'est parce que l'IA n'optimise que pour la vitesse.

“RL trouve un moyen de courir vite, mais étant donné une fonction de récompense sous-spécifiée, il n'a aucune raison de préférer une démarche “d'apparence naturelle” ou préférée par les humains”, Margolis raconte The Verge par e-mail. Il dit que le modèle pourrait certainement être chargé de développer une forme de locomotion plus fluide, mais le but de l'effort est d'optimiser uniquement la vitesse.

“Programmer comment un robot doit agir dans toutes les situations possibles est tout simplement très difficile”

Margolis et Yang disent qu'un grand avantage du développement d'un logiciel de contrôleur utilisant l'IA est qu'il prend moins de temps que de s'occuper de tous les la physique. “Programmer comment un robot doit agir dans toutes les situations possibles est tout simplement très difficile. Le processus est fastidieux car si un robot devait tomber en panne sur un terrain particulier, un ingénieur humain devrait identifier la cause de la panne et adapter manuellement le contrôleur du robot », expliquent-ils.

Mini Cheetah obtient le contrôle d'un chien non-robot. Image : MIT

En utilisant un simulateur, les ingénieurs peuvent placer le robot dans n'importe quel nombre d'environnements virtuels – de la chaussée solide aux décombres glissants – et le laisser faire les choses par lui-même. En effet, le groupe MIT affirme que son simulateur a pu parcourir 100 jours de titubation, de marche et de course en seulement trois heures de temps réel.

Certaines entreprises qui développent des robots à pattes utilisent déjà ce type de méthodes pour concevoir de nouveaux contrôleurs. D'autres, cependant, comme Boston Dynamics, s'appuient apparemment sur des approches plus traditionnelles. (Cela a du sens étant donné l'intérêt de l'entreprise à développer des mouvements très spécifiques – comme les sauts, les sauts et les retournements vus dans ses vidéos chorégraphiées.)

Il existe également des robots aux jambes plus rapides. . Le bot Cheetah de Boston Dynamics détient actuellement le record d'un quadrupède, atteignant des vitesses de 28,3 mph – plus rapide qu'Usain Bolt. Cependant, non seulement Cheetah est une machine beaucoup plus grande et plus puissante que la Mini Cheetah du MIT, mais elle a atteint son record de fonctionnement sur un tapis roulant et montée sur un levier pour la stabilité. Sans ces avantages, l'IA donnerait peut-être du fil à retordre à la machine.