Agenti al servizio dell’estrazione dei dati
Tra i passi da seguire nella procedura di estrazione di conoscenza da banche dati di grandi dimensioni, l’estrazione di dati è un elemento centrale. Le tecniche per automatizzare l’estrazione di più modelli sono state inizialmente sviluppate per i dati centralizzati. Poiché l’industria e la scienza si basano sempre di più su risorse di calcolo disperse geograficamente, hanno iniziato ad emergere i metodi per l’estrazione di dati distribuiti. In realtà, sono disponibili numerose soluzioni che sfruttano tecniche come l’agglomerazione, la classificazione e la regressione distribuite. Tuttavia, solo alcune di loro si basano su agenti intelligenti in grado di controllare un numero crescente di compiti di estrazione dati. Il progetto ADMIT (“Agent-oriented distributed data mining using computational statistics”), finanziato dall’UE, ha esplorato il valore aggiunto dei concetti presi in prestito dalla tecnologia degli agenti. In sistemi a più agenti, i comportamenti individuali e collettivi degli agenti dipendono dai dati osservati. I ricercatori di ADMIT hanno considerato le tecniche di elaborazione dati decentralizzate, compresa la previsione della regressione e l’analisi del punto di cambiamento per stabilire se e quando si è verificato un cambiamento in una banca dati. Questi modelli di coordinazione dei dati sono stati applicati per la presa delle decisioni e hanno ottenuto prestazioni simili a quelli con un’autorità centrale. La sinergia tra tali comunità di agenti e il cloud computing ha offerto prospettive aggiuntive per le nuove tecnologie. I ricercatori di ADMIT hanno esaminato l’agglomerazione di dati decentralizzati che rappresenta un importante passo di pre-elaborazione dati nei depositi di dati cloud. Mediante il raggruppamento di dati simili, è stato possibile costruire dati più precisi che rappresentano l’applicazione come un’ottimale selezione del percorso e l’adattamento della velocità nel traffico. I numerosi risultati di ADMIT sono stati presentati in occasione di 11 conferenze internazionali. Sono inoltre stati pubblicati sedici documenti in procedure di conferenza e riviste scientifiche specializzate. Cosa più importante, i metodi proposti sono stati integrati in sistemi di trasporto intelligente per la gestione del traffico e il monitoraggio dell’ambiente, e convalidati mediante dati sul traffico del mondo reale dalla città tedesca di Hannover.
Parole chiave
Estrazione dei dati, agenti del software, cloud computing, agglomerazione dei dati, trasporto intelligente