Skip to main content

A Sequence Classification Framework for Human Language Technology

Article Category

Article available in the folowing languages:

In che modo le macchine interpretano il linguaggio umano

Accrescendo le nostre conoscenze in merito alle modalità con cui i sistemi automatici elaborano il linguaggio umano, il progetto SEQCLAS ha gettato le basi per portare le tecnologie di testo e linguaggio alimentate dall’intelligenza artificiale al livello successivo.

Economia digitale

Hai mai provato a diventare fluente in una lingua straniera studiando liste di parole e regole grammaticali? Se sì, probabilmente non hai fatto molta strada. Acquisire esperienza ascoltando, leggendo e parlando è fondamentale nel processo di apprendimento umano. È lo stesso quando si tratta di sviluppare tecnologie del linguaggio umano (HLT, human language technologies), quali il riconoscimento vocale, la traduzione automatica e il riconoscimento ottico del testo. Il progresso in questi campi è stato guidato da enormi sviluppi nell’IA: le reti neurali sono addestrate con dati reali per riconoscere e tradurre il linguaggio in modo più accurato. Per aiutarle a raggiungere il loro pieno potenziale, il progetto SEQCLAS ha esaminato ciò che accomuna queste tre tecnologie. Finanziato dal Consiglio europeo della ricerca (CER), il progetto ha considerato le reti neurali da un punto di vista olistico basato sulla teoria statistica delle decisioni. Il suo contributo potrebbe permettere ai team che lavorano sulle HLT di valutare criticamente e migliorare gli algoritmi.

Capacità di discriminazione

«In tutte e tre le aree di applicazione, è il contesto che permette al sistema di ottenere una migliore interpretazione dell’input e di produrre un output più accurato», spiega Hermann Ney, responsabile dello Human Language Technology and Pattern Recognition Group presso l’Università tecnica di Aquisgrana, in Germania, e ricercatore principale del progetto SEQCLAS. Per quanto riguarda il linguaggio, tuttavia, questo contesto è complesso e multistrato. Come può la macchina imparare a distinguere «anno» da «hanno» per trascriverlo correttamente, o a distinguere il sostantivo «pesca» in base al suo significato, per scegliere la giusta traduzione? «Se prendiamo l’esempio del riconoscimento vocale, ogni suono deve essere considerato come parte di una sequenza (una parola, una frase, persino un dialogo) per interpretarne correttamente il significato», afferma Ney. Elaborare e classificare tali sequenze significa permettere alle reti neurali di riconoscere i modelli che le strutturano. Il team di SEQCLAS ha esaminato questa sfida dal punto di vista della teoria della decisione. Questo quadro sottolinea l’importanza del criterio di rendimento (ad esempio il numero di errori) per queste attività di elaborazione sequenza per sequenza. «Di conseguenza, il criterio di rendimento può essere usato per migliorare la struttura e l’addestramento dei sistemi basati sulle reti neurali», osserva Ney. «Per quanto riguarda la traduzione automatica, questo rendimento può essere più difficile da quantificare», ammette Ney, «a causa dell’esistenza di diverse interpretazioni e traduzioni possibili.»

Intuizione per il progresso

Per completare il loro lavoro concettuale, i ricercatori hanno lavorato su una serie di modelli e test traducendoli in miglioramenti pratici. Hanno usato tecniche di apprendimento non supervisionato e semi-supervisionato per consentire la traduzione automatica utilizzando dati monolingue nelle lingue di partenza e di arrivo. Questo lavoro potrebbe per esempio contribuire a rendere disponibili traduzioni automatiche migliori per coppie di lingue meno comuni. Ney e i suoi colleghi hanno anche consegnato diversi prototipi di sistemi che serviranno come base per ulteriori ricerche in questo campo promettente. Crede che l’approccio olistico del progetto offra anche una prospettiva storica unica sui concetti alla base dell’HLT. «Tendiamo a dimenticare che le reti neurali sono utilizzate per il riconoscimento vocale da oltre 30 anni. Il loro sviluppo è stato a lungo frenato dalla mancanza di potenza di calcolo», aggiunge Ney. «Rivalutare e aggiornare la ricerca esistente alla luce delle capacità e delle intuizioni di oggi potrebbe aiutarci a raggiungere ulteriori progressi in questo campo.»

Parole chiave

SEQCLAS, tecnologia del linguaggio umano, riconoscimento vocale, riconoscimento ottico del testo, traduzione automatica, rete neurale, algoritmo, apprendimento non supervisionato, apprendimento semi-supervisionato

Scopri altri articoli nello stesso settore di applicazione