L'apprentissage machine de la nouvelle génération en Europe
Les méthodes d'apprentissage machine actuelles luttent avec la portée croissante et la complexité de grands nombres de tâches et d'objectifs. Au fur et à mesure que la technologie avance et que les algorithmes d'apprentissage deviennent des composants clés, ils devront faire face à cette plus grande complexité. Ceci étant, le projet financé par l'UE HERL (Large scale machine learning for simultaneous heterogeneous tasks) cherche à proposer un outil qui examine les performances des nouveaux algorithmes et des algorithmes existants pour résoudre des problèmes d'apprentissage de renforcement multitâches. Il cherchait également à créer des algorithmes pour gérer de nombreux objectifs simultanés. Les partenaires du projet ont d'abord développé un générateur de problèmes aléatoire pour l'apprentissage des problèmes baptisé Merlin. Il est unique dans sa capacité à générer des problèmes d'apprentissage multitâches avec contrôle de la structure des relations inter-tâches. Merlin est maintenant disponible gratuitement et est amélioré en permanence pour offrir un plus large éventail de structures de problème. L'équipe HERL a développé une plateforme logicielle pour appliquer des algorithmes de renforcement multitâches. Elle a également analysé des données concernant les performances de différents algorithmes d'apprentissage qui ont été développés et testés sur des problèmes réels et générés. Pour ce faire, les chercheurs ont d'abord produit des structures de problèmes connus et ont ensuite étudié ces problèmes pour concevoir des algorithmes d'apprentissage plus efficaces. Grâce à HERL, Merlin permet aux chercheurs d'apprentissage par le renforcement d'évaluer comment leurs algorithmes peuvent être efficaces sur un plus large éventail de problèmes par rapport à ceux utilisés par leurs pairs. Les nouveaux algorithmes peuvent affronter les problèmes avec plus de deux ou trois objectifs simultanés. Les systèmes d'apprentissage machine de demain seront plus efficaces, avec une intervention humaine directe et un fardeau informatique moindres.
Mots‑clés
Apprentissage machine, algorithmes, taches hétérogènes, apprentissage par renforcement