Lutte contre les menaces informatiques
L'exploration de données correspond au processus de recherche de nouveaux modèles dans de grandes ensembles de données. Ces modèles peuvent être considérés comme une sorte de synthèse des données et peuvent être utilisés directement ou dans le cadre d'analyses futures. En l'état actuel, la technique présente un inconvénient: malgré l'existence de techniques bien comprises pour l'exploration simple et la synthèse de données, le traitement de synthèses de données de flux plus sophistiquées susceptibles de varier en débit et en volume reste un problème difficile. La résolution de ce problème complexe était l'objectif du projet DMASD4CA («Distributed multi-way analysis of stream data for detection of complex attacks»). Cette étude a pris en considération divers moyens d'améliorer l'exploration de flux de données complexes en examinant des collections de données, des analyses et des extractions de connaissances. Le projet a mis en évidence que pour obtenir des informations statistiques et structurelles plus fiables, il était nécessaire de surveiller et d'analyser des flux de données provenant de plusieurs emplacements de manière collaborative. Tout d'abord, un échantillonnage coordonné a été nécessaire pour garantir une indépendance parmi les agents, à savoir les programmes qui collectent les données. Il a ensuite fallu concevoir des versions en ligne ou en temps quasi réel des procédés d'analyse des données. Le projet DMASD4CA a développé des techniques avancées d'analyse de données complexes (multidimensionnelles) afin d’en déterminer la structure. Le procédé d'analyse résultant, développé pour détecter des activités hostiles, peut être utilisé pour protéger les systèmes informatiques contre les attaques de pirates. Il peut aussi former la base d'un système d'alerte précoce afin de produire des réponses rapides à des événements critiques, tels que des catastrophes naissantes, des flambées épidémiques ou des attaques terroristes.