Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

H2020

TOREADOR — Résultat en bref

Project ID: 688797
Financé au titre de: H2020-EU.2.1.1.
Pays: Espagne
Domaine: Économie numérique

Analyse des mégadonnées pour les nuls

Les mégadonnées restent encore une notion élitiste: seules les entreprises les plus expertes en informatique et les plus riches ont une chance d’effleurer leur potentiel. Cette situation pourrait être sur le point de changer grâce à une plateforme d’analyse des mégadonnées développée dans le cadre du projet TOREADOR, qui traitera automatiquement tous les problèmes majeurs liés à la préparation des données à la demande.
Analyse des mégadonnées pour les nuls
«Les attentes à l’égard des mégadonnées sont très élevées, mais l’écart entre l’ambition et l’exécution reste important, en particulier pour les PME», affirme Ernesto Damiani. Ce dernier est bien placé pour le savoir: en effet, depuis le début de 2016, le Dr Damiani dirige un consortium de 10 personnes qui se penchent sur les raisons de ces résultats mitigés et les solutions possibles.

Si relativement peu de PME ont intégré l’analyse des mégadonnées dans leurs offres ou leurs processus internes, c’est principalement pour deux raisons. La première est liée à un manque de compétences en matière d’analyse des mégadonnées, comme l’explique le Dr Damiani. Par exemple, une entreprise désireuse d’adapter son offre au comportement de ses clients à l’aide d’une application gratuite devrait recourir à des services de conseil très coûteux. Il s’agit actuellement du seul moyen de faire correspondre les objectifs opérationnels à une catégorie de solutions en science et technologie des données.

«Concrètement, l’énoncé de projet pourrait être formulé comme suit: “recueillir les événements générés par les applications des clients-clés et les utiliser pour établir une classification par forêts aléatoires multi-catégorie et évolutive de leur comportement à déployer sur un service de cloud computing public”», a-t-il affirmé.

La deuxième raison est liée au long délai de déploiement et, encore une fois, au coût prohibitif des campagnes de mégadonnées, même lorsque l’approche scientifique des données a déjà été identifiée. La combinaison de ces problèmes a éloigné les PME et les entreprises non expertes dans les TIC de l’analyse des mégadonnées, bien qu’elles représentent une part substantielle de l’épine dorsale de l’industrie manufacturière de l’UE.

La méthodologie et la boîte à outils TOREADOR (TrustwOrthy model-awaRE Analytics Data platfORm) offrent une solution à ces deux problèmes: elles automatisent et facilitent l’analyse de mégadonnées, tout en simplifiant son adaptation aux besoins spécifiques des clients du domaine.

Le cadre de TOREADOR prend en charge deux transformations automatisées: la première part d’un modèle déclaratif lisible par machine qui recueille les objectifs du propriétaire des données et se termine par un modèle de procédure indépendant de la technologie et sensible à la sémantique, décrivant le calcul à effectuer. La deuxième transformation s’appuie sur le modèle de procédure visant à calculer un modèle de déploiement dépendant de la technologie. Cette dernière peut être exécutée sur une plateforme Apache, chez le client, sur des services cloud commerciaux comme AWS, sous forme de code Python exécutable sur la plateforme Azure ou sous forme de conteneur Docker.

«Nos modèles déclaratifs peuvent collecter de manière interactive les objectifs commerciaux des campagnes de mégadonnées et permettre à l’outil TOREADOR de fournir des conseils automatiques sur la faisabilité des solutions. Nos modèles de procédure fournissent ensuite une description innovante du calcul analytique des mégadonnées dans les normes OWL/S sensibles à la sémantique et nos compilateurs traduisent ces modèles de procédure en flux de travail entièrement exécutables ou même en code Python nativement parallèle. Nous cherchons à concevoir un processus de développement itératif, où les utilisateurs non experts en informatique peuvent rapidement mettre en place une campagne en générant un flux de travail exécutable sur un service cloud public, puis, si nécessaire, faire appel à des développeurs pour générer le code Python autonome», explique le Dr Damiani.

Les partenaires du projet ont déjà identifié quatre pilotes industriels dans les domaines de la maintenance prédictive des moteurs d’avions, de la gestion prédictive des centrales solaires, de l’analyse des journaux des applications d’entreprise et de l’analyse des parcours de navigation pour les applications de commerce électronique.

«La plateforme TOREADOR est disponible et a été déployée sur les quatre sites pilotes. Elle a également été mise gratuitement à la disposition de certains membres de la communauté TOREADOR, composée d’entreprises européennes (dont plusieurs PME) recrutées avec l’aide de TAIGER (Espagne), une PME innovante du consortium TOREADOR. Veuillez consulter notre site Web pour plus de détails sur ces adeptes précoces. En outre, la méthodologie TOREADOR a été mise à la disposition d’autres projets européens utilisant des campagnes de mégadonnées comme EVOTION», explique le Dr Damiani.

L’achèvement du projet est prévu pour la fin 2018. En attendant, le consortium a l’intention de continuer à élargir le catalogue de services disponibles sur la plateforme et de fournir des exemples de campagnes de mégadonnées compatibles avec TOREADOR, y compris la formation et le déploiement de modèles avancés d’apprentissage machine.

Informations connexes

Mots-clés

TOREADOR, PME, mégadonnées, analytique, entreprise, boîte à outils, cloud