Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

H2020

EoT — Résultat en bref

Project ID: 643924
Financé au titre de: H2020-EU.2.1.1.1.
Pays: Espagne
Domaine: Économie numérique

Les yeux du monde

La vision artificielle est la modalité de détection la plus exigeante en termes de consommation d’énergie et de puissance de traitement. Le projet européen EoT a relevé ce défi avec succès.
Les yeux du monde
La vision par ordinateur, également appelée vision artificielle, se propage rapidement au-delà de la recherche universitaire et est utilisée dans des processus d’automatisation industriels comme le contrôle qualité. Munies des plateformes et outils appropriés, les utilisations émergentes semblent désormais infinies dans les applications portables, la réalité augmentée, la surveillance et l’assistance à la vie à domicile, entre autres.

La vue, notre capteur le plus riche, extrait le Big Data de la réalité. La quantité de données générées dans le monde par les capteurs d’image dépasse de loin celle générée par tous les autres capteurs combinés. «Pour la première fois, notre projet EoT a relevé de front le défi posé par la puissance de traitement nécessaire à la vision artificielle», explique le professeur Oscar Deniz Suarez, coordinateur du projet EoT.

«L’objectif consistait à construire une plateforme de vision de base optimisée en termes de puissance, de taille, de coûts et de programmabilité, capable de travailler de manière autonome et pouvant être intégrée dans tous les types d’objets», poursuit-il. Selon le consortium, la capacité de réaliser une inférence d’apprentissage profond ne faisait pas partie des objectifs initiaux du projet mais a été ajoutée ensuite comme résultat dérivé très souhaitable.

Une vision informatique intégrée efficace avec apprentissage profond

Le résultat est une plateforme de vision par ordinateur intégrée extrêmement efficace rendue possible par l’élément matériel clé, un processeur ultra basse puissance Myriad 2 de Movidius. «Parmi les fonctionnalités notables, on citera l’inférence d’apprentissage profond et le wifi à faible consommation avec une application légère de messagerie et de lecture vidéo en continu, capable d’envoyer des alarmes aux périphériques, un chargeur de batterie interne et un connecteur audio», explique le professeur Suarez.

La carte peut actuellement interfacer 3 caméras différentes et ses dimensions physiques sont petites: 48 x 56 mm. La carte matérielle a été développée dans la première moitié du projet sur le principe du retrait de composants afin de réduire au maximum la taille et le poids du produit fini. Le développement de logiciels pouvait alors se poursuivre en parallèle avec les unités existantes sans impact majeur.

Trois démonstrateurs, une foule d’applications

Les partenaires du projet ont mis au point trois démonstrateurs pour illustrer les fonctions potentielles de la technologie: une poupée dans laquelle la carte est intégrée au corps et à la tête, un casque et un système de détection de déchets illégaux. «Il convient de noter que tous les systèmes sont conformes à la conception du respect de la vie privée et qu’aucune image n’est enregistrée ni transmise», souligne le professeur Suarez.

La poupée illustre la fonction d’apprentissage profond en reconnaissant l’une des six expressions faciales possibles. De plus, EoT estime que l’application peut fonctionner en continu pendant un maximum de 13 heures avec une seule charge d’une batterie plate de 4 000 mAh.

Un casque conçu pour les musées reconnaît automatiquement un tableau et fournit au visiteur des informations audio pertinentes. La carte EoT dans le casque se connecte également à une application pour smartphone pour des expériences multimédia/interactives. Le système a été mis à l’essai au musée Albertina de Vienne, de renommée mondiale, et servira de base à une proposition de nouveau projet qui constitue les dernières étapes de la production.

Le «Litterbug» est un autre démonstrateur. Il s’agit d’un dispositif EoT qui empêche le rejet illégal de déchets en détectant d’abord l’acte avec une caméra, puis en émettant des avertissements sonores à mesure que l’infraction se produit.

Commercialisation – l’avenir de la vision par ordinateur

Ubotica Technologies est une start-up créée par d’anciens employés de ses partenaires, détenant, outre une licence lui permettant de développer une vaste gamme de produits basés sur EoT, toute l’expérience nécessaire. «La puce Myriad 2 au cœur d’EoT est un dispositif complexe à maîtriser, à intégrer à d’autres composants électroniques et à déployer», souligne le professeur Suarez. Elle comprend le logiciel complexe associé au processeur, aux capteurs, aux communications et à la vision optimisée, ainsi que l’inférence d’apprentissage profond. «Ubotica dispose déjà de l’expertise nécessaire pour développer les variantes EoT dans les meilleurs délais», conclut le professeur Suarez.

Mots-clés

EoT, apprentissage profond, vision par ordinateur, capteurs, vision artificielle, Myriad 2