Skip to main content
European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-05-27

Systemic Intelligence for GrowiNg up Artefacts that Live

Article Category

Article available in the following languages:

Apprendre aux robots à grandir

Éduquer les robots au lieu de simplement les programmer constitue actuellement l'une des idées les plus intéressantes en matière de contrôle sur les robots. Des chercheurs européens ont mis en place un moyen permettant à un robot de développer sa base de connaissance, lui permettant ainsi d'apprendre par l'expérience.

Économie numérique icon Économie numérique

L'objectif du consortium SIGNAL était de développer un dispositif qui permettrait de partir d'un système infantile pour «grandir» jusqu'à devenir une entité à maturité. Pour parvenir à cet objectif, les partenaires du projet ont formé une équipe interdisciplinaire avec des groupes de recherche issus à la fois des technologies de l'information et des sciences de la vie. Le robot a été assisté dans son «développement» par une stratégie et une structure combinées appelées l'architecture systémique. «Grandir» et développer ses connaissances par l'apprentissage et l'expérience sont des caractéristiques clés des organismes vivants. L'équipe du projet a formé un système de contrôle de robot utilisant un réseau de système immunitaire artificiel fondé sur des systèmes d'associations de type règle (RLA, de l'anglais Rule-like association). Les RLA peuvent être appliquées avec succès au contrôle des robots et à la formation du comportement des robots par un apprentissage renforcé. Les RLA construisent l'architecture systémique hiérarchique du dispositif, ce qui l'aide à «grandir». Chaque RLA contient des informations sur l'environnement du robot et est constituée de trois parties. La RLA inclut une condition sensorielle C, une commande d'action A, et une attente d'entrée sensorielle imminente, E. Les chercheurs ont généré des RLA à l'aide d'une mémoire à court terme, qui stocke de brèves séquences d'information concernant des événements sensoriels et moteurs récents et significatifs. Les informations contenues dans la mémoire à court terme sont utilisées comme base pour créer de nouvelles RLA. Cependant, la RLA inclut une attente E qui s'intéresse aux conséquences d'une action. Par conséquent, la RLA ne peut être créée que lorsque le système dispose des informations concernant la conséquence E si l'action A a été effectuée. La connexion des RLA permettant de créer un réseau augmente la quantité de connaissances qu'un robot possède sur son environnement. Le robot, qui possède des capteurs infrarouges et est autonome et mobile, est capable d'adopter des comportements différenciés, comme par exemple longer un mur ou éviter des obstacles. Les résultats indiquent que les robots n'ont plus besoin d'être programmés s'ils peuvent apprendre des tâches en effectuant des actions et en jugeant le comportement obtenu.

Découvrir d’autres articles du même domaine d’application