Skip to main content
European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

Article Category

Notizie
Contenuto archiviato il 2023-03-02

Article available in the following languages:

Progetto TSI per migliorare la ricerca delle notizie on-line

Alcuni ricercatori impegnati in un progetto finanziato dall'UE hanno sviluppato una serie di strumenti per il web semantico che a loro parere aiuterà gli utenti a reperire più rapidamente le notizie che più li interessano on-line. La piattaforma del progetto «News Engine Web...

Alcuni ricercatori impegnati in un progetto finanziato dall'UE hanno sviluppato una serie di strumenti per il web semantico che a loro parere aiuterà gli utenti a reperire più rapidamente le notizie che più li interessano on-line. La piattaforma del progetto «News Engine Web Services» (NEWS, servizi per la ricerca di notizie sul web) comprende un sistema di annotazione basato su criteri ontologici e di classificazione che consente ai computer di «leggere» le notizie sul web in numerose lingue e di analizzarne il contenuto, fornendo i risultati che meglio soddisfano le esigenze dell'utente. Un utente non correttamente informato potrebbe immaginare che queste siano le operazioni che un computer normalmente esegue quando si effettua una ricerca on-line. In realtà, un computer non è in grado di effettuare le stesse operazioni senza il nostro intervento in quanto le pagine web sono progettate per essere lette da persone, non da macchine. Le tecnologie per il web semantico hanno lo scopo di cambiare tale stato di cose rendendo le pagine web comprensibili per i computer, in modo che questi ultimi possano effettuare ricerche su siti Internet e altre operazioni secondo modalità standard. Il sistema di annotazione basato sul web semantico sviluppato dal progetto NEWS consente alle agenzie giornalistiche di classificare meglio le informazioni, assicurando modalità di fornitura dei contenuti più personalizzate. «Finora la classificazione dei contenuti avveniva in genere in base a 12 termini come sport, notizie internazionali, finanza, che un giornalista conosce a memoria», spiega il dott. Ansgar Bernardi, coordinatore del progetto NEWS e vicedirettore del gruppo responsabile per la gestione della conoscenza presso il DFKI, il Centro di ricerca tedesco per l'intelligenza artificiale. «Ciò non garantisce risultati molto precisi. Il nostro sistema invece è in grado di analizzare automaticamente una storia e accedere ai 1 300 termini di classificazione utilizzati per definirla» prosegue il dott. Bernardi. Una delle caratteristiche del nuovo sistema di annotazione e classificazione è la sua capacità di distinguere persone o luoghi con lo stesso nome per evitare «falsi positivi». Ciò è possibile grazie ad un algoritmo adattivo chiamato «IdentityRank». «In realtà esso è nato come sottoprodotto del lavoro principale, ma funziona bene e credo che susciterà non poco interesse in ambito scientifico» afferma il dott. Bernardi. Abbinando il sistema ad un programma di riconoscimento vocale commerciale disponibile sul mercato, i partner del progetto hanno anche sviluppato una «prova di concetto» per analizzare file di informazioni in formato audio. Il sistema elaborato nell'ambito del progetto ha suscitato l'interesse delle agenzie giornalistiche e sono attualmente in corso progetti per una sua commercializzazione.