Skip to main content

Article Category

Story

Article available in the folowing languages:

Articoli di approfondimento - Data mining 3.0 - dalle info all'"intelligenza collettiva"

Un progetto finanziato dall'UE ha sviluppato una piattaforma che trasforma i contenuti generati dagli utenti, da un problema di sovraccarico di informazioni a una nuova intelligenza collettiva con una gamma di applicazioni, dalla gestione delle emergenze a un turismo urbano migliore. Il progetto si è canndidato per diversi brevetti e una manciata di prodotti e risultati sono destinati per il rilascio pubblico o commerciale. È questo l'inizio del data mining 3.0?

Economia digitale

L'informazione e la conoscenza aumentano a grandissima velocità. La nostra capacità di memorizzare, trasmettere ed elaborare le informazioni è cresciuta a un tasso annuo del 23% dal 1986. Entro il 2007 l'utente medio di Internet ha trasmesso in media il corrispondente di circa sei giornali al giorno, e ha ricevuto 174 giornali di dati, secondo uno studio pubblicato su Science nel febbraio scorso. Si aggiungono al carico di informazioni anche i siti di condivisione di social media, che ospitano miliardi di immagini e video, la maggior parte dei quali sono stati annotati e condivisi tra amici o pubblicati in gruppi che riguardano un argomento di interesse specifico. I dati stanno aumentando a un tasso tale da superare la nostra capacità di organizzarli. "È facile per gli utenti e le organizzazioni generare e condividere contenuti, individualmente o nelle comunità, grazie a dispositivi di comunicazione avanzati, come i laptop, i tablet e gli smartphone", spiega Yiannis Kompatsiaris, coordinatore del progetto finanziato dall'Unione europea WeKnowIt . Con tutti questi contenuti, l'estrazione di informazioni utili diventa estremamente complessa e costosa, e le applicazioni attuali non supportano completamente l'elaborazione e la gestione intelligente dei dati, osserva il dottor Kompatsiaris. "Gli utenti non riescono a elaborare le informazioni in modo efficiente e neanche a sfruttare le conoscenze inerenti," dice. Il progetto integrato WeKnowIt intende cambiare tutto questo, partendo con una visione che concettualizza le diverse forme di dati che incontriamo ogni giorno, trasformandoli in informazioni coerenti e utili, che il team WeKnowIt chiama "intelligenza collettiva". Il progetto è per la maggior parte incentrato sull'estrazione di dati generati dal bookmarking, tagging e networking sociali, in cui le opinioni e l'input collettivi creano una serie di dati altamente dettagliata. 'Ci sono diversi tipi di intelligenza che riceviamo ogni giorno e di processo', dice il dottor Kompatsiaris. "Ci sono contenuti digitali e informazioni contestuali che noi chiamiamo "media intelligence". Il feedback degli utenti su larga scala costituisce "l'intelligenza di massa", mentre le interazioni personali si chiamano "intelligenza sociale"; esse risultano tutte nell'intelligenza personale e organizzativa degli individui e delle aziende." La visione WeKnowIt nasce dalla convinzione che se combinate tra loro, queste diverse fonti di informazione potrebbero creare un'emergente "intelligenza collettiva", la quale può fortemente migliorare la capacità degli individui e delle istituzioni di individuare e agire sulle informazioni pertinenti al momento giusto. Quando è iniziato il lavoro di WeKnowIt nel 2008 questo era un obiettivo estremamente ambizioso, ma ora la visione è molto più vicina. Il progetto ha reclutato alcuni dei nomi più prestigiosi del mondo della gestione e dell'integrazione dei dati, tra cui il Politecnico di Brno nella Repubblica ceca, l'Università di Koblenz-Landau in Germania, Yahoo! in Spagna e Vodafone e il Centro di ricerca e tecnologia Hellas (CERTH) in Grecia. La società polacca Software Mind ha fornito lo sviluppo e l'integrazione del software, mentre l'Università di Sheffield e il Sheffield City Council, nel Regno Unito, hanno sviluppato strumenti chiave per scenari di utilizzo. In tutto, dieci organizzazioni partner della Repubblica ceca, Germania, Spagna, Grecia, Polonia e Regno Unito hanno dedicato tre anni e speso 7,5 milioni di euro, di cui 5,37 milioni di euro messi a disposizione dall'UE, per sviluppare una piattaforma e una serie di strumenti associati per aiutare le persone a gestire diversi tipi e fonti di informazioni in modo coeso. Piattaforma di base "Utilizzando una vasta gamma di strumenti la piattaforma WeKnowIt trasforma le informazioni su larga scala e scarsamente strutturate in argomenti, entità, punti di interesse, connessioni ed eventi sociali che hanno un senso," osserva il dott. Kompatsiaris. Per fare questo, il progetto ha sviluppato una piattaforma di base in forma di un'applicazione middleware che può essere distribuita su server per elaborare i dati in arrivo e incanalarli in modo efficace. I vari partner del progetto hanno poi sviluppato un gran numero di strumenti - oltre 20 in tutto - che possono essere distribuiti e combinati in diversi modi, direttamente o tramite la piattaforma di base WeKnowIt. "Abbiamo sviluppato sette strumenti per i casi di studio - uno scenario di interventi di emergenza e uno scenario di gruppo sociale di consumatori - e i partner ne hanno creati altri 13 per compiti specifici", spiega il dott. Kompatsiaris. ClustTour ("City exploration by use of hybrid clustering") è un esempio di strumento isolato sviluppato da CERTH-ITI per svolgere un compito specifico. Si tratta di un'applicazione di esplorazione online che aiuta gli utenti a trovare luoghi di interesse utilizzando gruppi di immagini, chiamati cluster, che corrispondono a punti di riferimento ed eventi. ClustTour utilizza sia informazioni visive che dei tag con una "cluster classification" e "merging module" per individuare le immagini che vanno insieme, poi posiziona l'oggetto su una mappa. Cliccando semplicemente sull'immagine, gli utenti possono scoprire cos'è disponibile per quel luogo. Questo può aumentare notevolmente le informazioni disponibili per le persone che esplorano una città, spiega il dottor Kompatsiaris. Una guida turistica convenzionale evidenzierebbe il Museo archeologico nazionale di Atene come un "punto d'interesse" (point of interest, POI). Ma ClustTour è andato molto oltre, individuando interessanti immagini relative alle esposizioni all'interno del museo, come l'Iscrizione arcageta, la collezione di Arte cicladica, una collezione di sculture ben note e anche una collezione di tesori d'oro scoperta da Schliemann, un archeologo tedesco. "È evidente che lo strumento ClustTour, sviluppato da WeKnowIt, è in grado di offrire un'esperienza di esplorazione e preparazione di viaggio dettagliata e ricca di mezzi," osserva il dott Kompatsiaris. E questo è solo uno dei molti strumenti. Inoltre, gli strumenti possono essere combinati tra loro. Ad esempio, il caso di studio del gruppo sociale di consumatori ha cercato di aiutare le persone a programmare una gita giornaliera con il computer e poi le ha guidate tramite il telefono cellulare durante il tour stesso. Per farlo ha usato una varietà di strumenti WeKnowIt, tra cui ClustTour, Fannr (un annotatore Flickr) e VIRaL, uno strumento di recupero e posizionamento visivo. Anche lo scenario di risposta alle emergenze combinava diversi strumenti WeKnowIt per aiutare a fornire informazioni pertinenti e tempestive per i servizi di soccorso. Ha usato un processo di caricamento intelligente che era in grado, ad esempio, di individuare una posizione sulla base di una foto inviata da un utente. Il sistema riusciva anche a stabilire il livello di Urgenza, valutando la gravità degli incidenti attraverso delle fotografie. Entrambi i casi di studio sono stati completati con successo, permettendo al progetto di concludere la sua fase formale all'inizio di quest'anno. Ma da allora il progetto ha assunto una vita propria. "Molti dei partner stanno continuando a sviluppare software e strumenti basandosi sul modello e sull'architettura definiti da WeKnowIt, e i partner restano in contatto e condividono informazioni su base continuativa", ha rivelato Kompatsiaris. Per esempio, CERTH-ITI, Yahoo! e l'Università di Coblenza e continuano la loro attività di ricerca e collaborazione su aspetti reali dell'estrazione di informazioni dai sociali media. Essi sono anche alla ricerca di nuove applicazioni compreso il settore delle news e dei grandi eventi, come le rassegne musicali e i festival cinematografici. Allo stesso tempo, l'Università di Sheffield e il Sheffield City Council stanno discutendo sulle versioni aggiornate di risposta alle emergenze del progetto. CERTH-ITI partecipa a una nuova società spin-out, chiamata Set Veribin, che agirà come aggregatore di contenuti in vari settori e aree commerciali. Saranno presi di mira due mercati importanti, quello delle notizie e quello dell'e-learning, e CERTH-ITI applicherà e svilupperà ulteriormente le tecniche di clustering dei social media sviluppate da WeKnowIt. Veribin è una società spin-out di ATC S.A. Information Technology Company e finanziamento start-up sono stati recentemente approvati dal Segretariato greco di ricerca e sviluppo, secondo il dott. Kompatsiaris. Nel frattempo, Software Mind sta sviluppando nuovi strumenti per il web semantico per il settore delle telecomunicazione e il settore finanziario, e la Vodafone utilizzerà le conoscenze acquisite nel progetto per sfruttare le infrastrutture di rete per nuovi servizi. L'Università di Coblenza ha stabilito una società spin-off, chiamata Kreuzverweis, sfruttando i risultati del progetto WeKnowIt partendo dal livello di intelligence organizzativa. Il progetto ha anche presentato domanda per nove brevetti. Questi sono soltanto una manciata dei prodotti e dei risultati pronti per il rilascio pubblico. Altri emergeranno nel corso del tempo, in particolare con la costituzione del gruppo di utilizzatori WeKnowIt, che aiuta le parti interessate a rimanere informate sugli ultimi sviluppi relativi al progetto. Il progetto WeKnowIt ha ricevuto finanziamenti di ricerca nell'ambito del Settimo programma quadro dell'UE, attraverso il sottoprogramma "Contenuti e semantica intelligenti". Link utili: - "Emerging, collective intelligence for personal, organisational and social use" - Record dei dati del progetto WeKnowIt su CORDIS Articoli correlati: - Progetto UE per una migliore gestione degli ambienti che richiedono un'intensa elaborazione di dati - Progetto UE offre un aiuto agli agenti di polizia sovraccaricati - Solving the crisis of choice online - The search - computers dig deeper for meaning