Des agents au service de l'exploration de données
L'exploration de données est un élément central du processus d'extraction de connaissances inconnues enfouies dans d'énormes bases de données. Initialement, les techniques pour automatiser l'extraction de motifs répétés ont été développées pour des données centralisées. Les domaines industriel et scientifique utilisant de plus en plus des ressources informatiques géographiquement dispersées, des méthodes ont commencé à apparaître pour l'exploration de données réparties. En fait, de nombreuses solutions sont disponibles, utilisant des techniques comme la mise en cluster répartie, la classification et la régression. Mais seul un petit nombre d'entre elles reposent sur des agents intelligents capables de contrôler un nombre croissant de tâches d'exploration de données. Le projet ADMIT («Agent-oriented distributed data mining using computational statistics»), financé par l'UE, a exploré la valeur ajoutée de concepts empruntés à la technique des agents. Dans les systèmes à plusieurs agents, les comportements individuels et collectifs des agents dépendent des données observées. Les chercheurs d'ADMIT ont étudié des techniques décentralisées de traitement des données, dont la prévision de régression et l'analyse du point de changement, pour déterminer si et quand un changement s'est produit dans un ensemble de données. Utilisés pour la prise de décision, ces modèles de coordination des données ont obtenu des performances similaires à celles d'une autorité centrale. La synergie entre ces communautés d'agents et le cloud computing (l'informatique dématérialisée) a apporté des perspectives supplémentaires pour de nouvelles solutions. Les chercheurs d'ADMIN ont analysé le regroupement de données décentralisées, qui est une étape importante du traitement préliminaire des données stockées dans des entrepôts situés dans le cloud. En regroupant des données similaires, ils ont construit des données plus précises pour des applications comme la sélection de l'itinéraire optimal et l'adaptation de la vitesse dans la circulation. Les nombreux résultats d'ADMIT ont été présentés dans le cadre de 11 conférences internationales. Seize articles ont également été publiés dans des comptes rendus de conférence et des revues scientifiques à comité de lecture. Plus important encore, les méthodes proposées ont été intégrées à des systèmes intelligents de transport pour la gestion du trafic et la surveillance de l'environnement, et validées en utilisant des données réelles de trafic de la ville de Hanovre en Allemagne.
Mots‑clés
Exploration de données, agents logiciels, cloud computing, informatique dématérialisée, données en cluster, transport intelligent