Agenti al servizio dell’estrazione dei dati
Tra i passi da seguire nella procedura di estrazione di conoscenza da banche dati di grandi dimensioni, l’estrazione di dati è un elemento centrale. Le tecniche per automatizzare l’estrazione di più modelli sono state inizialmente sviluppate per i dati centralizzati. Poiché l’industria e la scienza si basano sempre di più su risorse di calcolo disperse geograficamente, hanno iniziato ad emergere i metodi per l’estrazione di dati distribuiti. In realtà, sono disponibili numerose soluzioni che sfruttano tecniche come l’agglomerazione, la classificazione e la regressione distribuite. Tuttavia, solo alcune di loro si basano su agenti intelligenti in grado di controllare un numero crescente di compiti di estrazione dati. Il progetto ADMIT(si apre in una nuova finestra) (“Agent-oriented distributed data mining using computational statistics”), finanziato dall’UE, ha esplorato il valore aggiunto dei concetti presi in prestito dalla tecnologia degli agenti. In sistemi a più agenti, i comportamenti individuali e collettivi degli agenti dipendono dai dati osservati. I ricercatori di ADMIT hanno considerato le tecniche di elaborazione dati decentralizzate, compresa la previsione della regressione e l’analisi del punto di cambiamento per stabilire se e quando si è verificato un cambiamento in una banca dati. Questi modelli di coordinazione dei dati sono stati applicati per la presa delle decisioni e hanno ottenuto prestazioni simili a quelli con un’autorità centrale. La sinergia tra tali comunità di agenti e il cloud computing ha offerto prospettive aggiuntive per le nuove tecnologie. I ricercatori di ADMIT hanno esaminato l’agglomerazione di dati decentralizzati che rappresenta un importante passo di pre-elaborazione dati nei depositi di dati cloud. Mediante il raggruppamento di dati simili, è stato possibile costruire dati più precisi che rappresentano l’applicazione come un’ottimale selezione del percorso e l’adattamento della velocità nel traffico. I numerosi risultati di ADMIT sono stati presentati in occasione di 11 conferenze internazionali. Sono inoltre stati pubblicati sedici documenti in procedure di conferenza e riviste scientifiche specializzate. Cosa più importante, i metodi proposti sono stati integrati in sistemi di trasporto intelligente per la gestione del traffico e il monitoraggio dell’ambiente, e convalidati mediante dati sul traffico del mondo reale dalla città tedesca di Hannover.