En vedette - Data mining 3.0 - de l'information à l'«intelligence collective»

Un projet financé par l'UE a développé une plateforme qui transforme l'énorme contenu généré par les utilisateurs d'un problème d'excès d'informations en une nouvelle intelligence collective avec une large gamme d'applications, depuis la gestion des situations d'urgence à une expérience enrichie du tourisme en ville. Le projet a déposé plusieurs brevets et une série de produits et de résultats sont voués à une sortie publique et commerciale. Assistons-nous aux premiers pas du data mining (exploration de données) 3.0?

Économie numérique

Les informations et les connaissances se développent à grande vitesse. Notre capacité de stockage, de transmission et de traitement des informations connaît une croissance annuelle de 23% depuis 1986. En 2007, l'internaute moyen transmettait environ un volume d'informations équivalent à six journaux chaque jour et recevait l'équivalent en données de 174 journaux, selon une étude publiée dans la revue Science en février dernier. Les sites de réseaux sociaux contribuent également à la charge d'informations, en hébergeant des milliards d'images et de vidéos, pour la plupart annotées et partagées entre amis, ou publiées sur des groupes portant sur un thème particulier. Le volume de données augmente à un rythme qui dépasse notre capacité à les organiser. «Grâce aux outils de communication avancés tels que les ordinateurs portables, les tablettes numériques et les téléphones intelligents (smartphones), les utilisateurs et les organisations peuvent facilement générer et partager du contenu, de manière individuelle ou au sein de communautés», déclare Yiannis Kompatsiaris, coordinateur du projet WeKnowIt(s’ouvre dans une nouvelle fenêtre) financé par l'UE. Avec tout ce contenu, il devient extrêmement compliqué et coûteux d'extraire les informations utiles et les applications actuelles ne prennent pas totalement en charge le traitement et la gestion intelligentes des données, selon le Dr Kompatsiaris. Il affirme également que «les utilisateurs ne parviennent pas à traiter les données de manière efficace et ne peuvent pas exploiter les connaissances sous-jacentes». Le projet intégré WeKnowIt a été mis en place pour changer tout cela, en commençant par une vision qui conceptualise les différentes formes de données que nous rencontrons quotidiennement et en les regroupant en informations cohérentes et décisionnelles que l'équipe du projet WeKnowIt désigne sous le nom d'«intelligence collective». Le projet s'est concentré essentiellement sur l'extraction des types de données générées par l'utilisation de favoris, de marquages sociaux et de mise en réseau, dont les opinions et les entrées collectives créent un ensemble de données hautement détaillé. «Nous recevons et nous traitons différents types d'intelligence chaque jour», déclare le Dr Kompatsiaris. «Il y a le contenu numérique et les informations contextuelles que nous désignons sous le nom d'«intelligence des médias». Les retours des utilisateurs sur une grande échelle constituent l'«intelligence de masse», alors que les interactions personnelles constituent l'«intelligence sociale», l'ensemble aboutissant à l'intelligence personnelle et organisationnelle des individus et des entreprises». L'approche du projet WeKnowIt trouve ses origines dans la conviction que ces diverses sources d'informations combinées pouvaient créer les conditions d'émergence d'une «intelligence collective» pouvant enrichir de manière considérable la capacité des individus et des institutions à trouver et utiliser les informations pertinentes au bon moment. Il s'agissait d'un objectif extrêmement ambitieux lors des débuts du projet WeKnowIt en 2008, mais il est maintenant beaucoup plus envisageable. Le projet a recruté certains des plus grands noms dans le monde de la gestion de données et de l'intégration, comme l'Université de technologie de Brno en République tchèque, l'Université de Coblence-Landau, Yahoo! en Espagne et Vodafone et le Centre for Research and Technology Hellas (CERTH) en Grèce. La société polonaise Software Mind a fourni le développement du logiciel et l'intégration et l'Université de Sheffield et le conseil de la ville au Royaume-Uni ont développé des outils pour des scénarios d'usage. En tout, dix organisations partenaires d'Allemagne, d'Espagne, de Grèce, de Pologne de République tchèque et du Royaume-Uni ont passé trois ans et investi 7,5 millions d'euros; l'UE a participé à hauteur de 5,37 millions d'euros pour développer une plateforme et un ensemble d'outils associés pour aider les utilisateurs à prendre en charge différents types et sources d'informations de manière cohérente. Une plateforme de base «À l'aide d'une variété d'outils, la plateforme WeKnowIt transforme des énormes quantités d'informations faiblement structurées en thèmes, entités, sujets d'intérêts et connexions sociales pertinents», fait remarquer le Dr Kompatsiaris. Pour ce faire, le projet a développé une plateforme de base sous la forme d'une application en logiciel médiateur qui peut être déployée sur des serveurs pour traiter les données entrantes et les acheminer de manière efficace. Les différents partenaires du projet ont ensuite développé un grand nombre d'outils (plus de 20 en tout) qui peuvent être déployés et combinés de différentes manières, soit directement, soit via la plateforme de base WeKnowIt. «Nous avons développé sept outils pour les études de cas (un scénario de réaction d'urgence et un scénario de groupe social de consommateurs) et les partenaires du projet en ont créé 13 autres pour des tâches spécifiques», ajoute le Dr Kompatsiaris. «City exploration by use of hybrid clustering» (ClustTour) est un exemple d'outil autonome développé par CERTH-ITI pour une tâche spécifique. Il s'agit d'une application d'exploration en ligne qui aide les utilisateurs à trouver les endroits intéressants en utilisant des groupes de photos appelés clusters, qui correspondent à des points de repère et des événements. ClustTour utilise à la fois les informations visuelles et les marquages avec une «classification de cluster» et un «module de fusion» pour identifier les photos correspondantes pour ensuite placer l'objet sur une carte. Les utilisateurs peuvent simplement cliquer sur les photos pour voir ce qu'il y a à cet endroit. «Ceci peut enrichir de manière considérable les informations disponibles pour les personnes qui explorent une ville», explique le Dr Kompatsiaris. Un guide touristique traditionnel identifierait le Musée national d'archéologie d'Athènes comme un endroit intéressant. Mais ClustTour fournit beaucoup plus de détails en identifiant les photos intéressantes concernant les expositions se déroulant dans le musée, telles que Arkhagetas Inscription, la collection d'art cycladique ancien, une collection de sculptures bien connues et même une collection de trésors en or découverts par Schliemann, un archéologue allemand. «Il apparaît évident que l'outil ClustTour développé par WeKnowIt peut fournir une exploration très raffinée et riche en médias, ainsi que des moyens de préparation de voyages», fait remarquer le Dr Kompatsiaris. Et il ne s'agit que de l'un des nombreux outils. De plus, les outils peuvent être utilisés conjointement. Par exemple, l'étude de cas de groupe social de consommateurs visait à aider l'utilisateur à planifier une journée de voyage avec un PC puis à le guider par téléphone portable pendant la visite elle-même. Pour ce faire, une variété d'outils de WeKnowIt étaient utilisés, notamment ClustTour, Fannr (un annotateur Flickr) et VIRal, un outil d'extraction et de localisation visuelle. Le scénario de réaction d'urgence a également combiné différents outils WeKnowIt pour fournir des informations pertinentes, dans les temps, pour les services d'urgence. Il utilisait un traitement de chargement intelligent qui pouvait, par exemple, identifier un site à partir d'une photo envoyée par un utilisateur. Le système peut même évaluer le niveau d'urgence en évaluant la gravité d'un incident à partir de photos. Les deux études de cas ont été réalisées avec succès et le projet a fini sa phase formelle plus tôt cette année. Mais le projet a évolué depuis pour mener sa propre vie. «Un grand nombre de partenaires continuent de développer des logiciels et des outils autour du modèle et de l'architecture définis par WeKnowIt et les partenaires restent en contact et partagent des informations de manière permanente», déclare le Dr Kompatsiaris. Par exemple, CERTH-ITI, Yahoo! et l'université de Coblance continuent leurs activités de recherche et la collaboration sur les aspects de temps réel de l'extraction d'informations des médias sociaux. Ils étudient également de nouvelles applications, notamment pour le secteur des actualités et des grands événements, comme les festivals de musique et de cinéma. Dans le même temps, l'université de Sheffield et le conseil de la ville de Sheffield travaillent sur des versions actualisées de réaction d'urgence du projet. CERTH-ITI participe à une nouvelle société issue de l'essaimage, appelée Veribin, qui servira d'agrégateur de contenus dans différents secteurs et domaines commerciaux. Les deux principaux marchés ciblés seront le domaine des actualités et de la formation en ligne; CERTH-ITI appliquera et développera les techniques de clustering de médias sociaux développées dans WeKnowIt. Veribin est une société essaimée d'ATC S.A. Information Technology Company et le financement de start-up ont été récemment approuvés par le Secrétariat grec pour la recherche et le développement, selon le Dr Kompatsiaris. De son côté, Software Mind développe de nouveaux outils pour le web sémantique pour les secteur des télécommunications et des finances et Vodafone utilisera les connaissances issues du projet pour exploiter l'infrastructure réseau pour de nouveaux services. L'université de Coblance a établi une société essaimée appelée Kreuzverweis qui exploite les résultats du projet WeKnowIt sur la couche d'intelligence organisationnelle. Le projet a également déposé neuf brevets. Il s'agit là seulement de quelques-uns des produits et des résultats destinés à une diffusion publique. D'autres émergeront dans le temps, en particulier avec la mise en place du groupe d'utilisateurs WeKnowIt, qui permet aux parties impliquées de s'informer des derniers développements du projet. Le projet WeKnowIt a reçu un financement de recherche dans le cadre du septième programme-cadre (7e PC) de l'UE, pour le sous-programme «Contenu intelligent et sémantique». Liens utiles: - «Emerging, collective intelligence for personal, organisational and social use»(s’ouvre dans une nouvelle fenêtre) - Archives de données du projet WeKnowIt sur CORDIS Articles connexes: - Un projet de l'UE pour faciliter la voie vers les environnements à grands volumes de données - Un projet de l'UE vient en aide aux agents de police surchargés - Solving the crisis of choice online(s’ouvre dans une nouvelle fenêtre) - The search - computers dig deeper for meaning(s’ouvre dans une nouvelle fenêtre)

Télécharger Télécharger le contenu de la page