Dare voce a ogni lingua: audiolibri potenziati dall’intelligenza artificiale per tutti
Questo metodo basato sull’IA riduce i costi di produzione di quasi il 60% e fa sì che i tempi di produzione siano di appena un’ora.
Aistis Raudys, amministratore delegato di AAI Labs
«Le lingue a basse risorse, ovvero quelle che dispongono di dati digitali limitati e di pochi strumenti in grado di aiutare i computer a pronunciare il testo, sono spesso trascurate nel mercato degli audiolibri», spiega Aistis Raudys, amministratore delegato di AAI Labs(si apre in una nuova finestra), un’azienda lituana specializzata in soluzioni di apprendimento automatico (AA) e di intelligenza artificiale (IA) generativa. Nel 2022, un consorzio guidato da AAI Labs ha ricevuto finanziamenti dall’UE, da LMT(si apre in una nuova finestra), da HAMAG-BICRO(si apre in una nuova finestra) e da DSTI(si apre in una nuova finestra) per lo sviluppo di Audiobooks for Everyone (AFE), una piattaforma alimentata dall’IA che rende più veloce ed economica la creazione di audiolibri in lingue spesso trascurate. Il sostegno è stato fornito da Eurostars(si apre in una nuova finestra), programma svolto nell’ambito del Partenariato europeo per le PMI innovative, che aiuta le piccole imprese innovative a collaborare con partner internazionali al fine di immettere nuove tecnologie sul mercato. Grazie a questo finanziamento e a un’attiva collaborazione transfrontaliera, AAI Labs e i suoi partner hanno combinato competenze nell’IA con know-how in materia editoriale di Europa e Africa, creando una soluzione che rende disponibile il mercato degli audiolibri a un maggior numero di lingue, lettori ed editori.
Abbattere le barriere
Senza avere a disposizione la tecnologia più appropriata a tal fine, la produzione di audiolibri rimane troppo costosa, soprattutto per i piccoli editori e autori, creando un circolo vizioso nel quale queste lingue continuano a essere poco servite. AFE ricorre all’impiego di una tecnica all’avanguardia di IA per cambiare le carte in tavola. «L’innovazione principale di AFE, ossia la clonazione vocale multilingue, funge da traduttore vocale, consentendo al software di utilizzare un campione di voce per narrare un testo in lingue non parlate dal proprietario della voce stessa», spiega Raudys. Un singolo narratore può «dare voce» a una storia in più lingue, permettendo di realizzare audiolibri coinvolgenti e con più personaggi senza dover ingaggiare un cast completo. Il progetto ha riunito team provenienti da Lituania, Croazia e Sudafrica. AAI Labs ha guidato lo sviluppo tecnico, costruendo i sistemi e i modelli di sintesi vocale, mentre Bulaja Naklada(si apre in una nuova finestra) si è occupata della raccolta e del test dei dati europei; infine, Quickfox Publishing(si apre in una nuova finestra) ha fornito i dataset delle lingue africane e ha sviluppato una suite di creazione di audiolibri di facile utilizzo. «Questa squadra è stata essenziale, combinando le competenze tecniche con la comprensione del mercato al fine di garantire che il prodotto fosse di successo, inclusivo e pronto per i mercati dell’Africa e dell’Europa», spiega Raudys.
Allargare gli orizzonti culturali
La partecipazione al Partenariato europeo per le PMI innovative è stata fondamentale. «La partnership ha immediatamente ampliato l’accesso al mercato per la Lituania fornendo nuove opportunità commerciali e contatti in Croazia e Sudafrica» osserva Raudys. Oltre ai finanziamenti, ha facilitato lo scambio di competenze: AAI Labs ha condiviso il know-how in materia di IA, mentre i partner editoriali hanno fornito indizi pratici che hanno contribuito allo sviluppo di soluzioni pronte per il mercato. AFE ha già ottenuto risultati significativi. «Il più importante risultato del progetto è l’inclusione di successo di diverse lingue a basse risorse, come lo zulu, lo xhosa, l’afrikaans, il croato e il lituano», afferma Raudys. In precedenza, queste lingue erano quasi del tutto assenti dal mercato degli audiolibri; la tecnologia crea nuove opportunità commerciali per gli editori e offre agli ascoltatori l’accesso a una gamma più ampia di letteratura in formati e lingue di cui possono fruire. Oltre alle lingue a basse risorse, AFE si è occupato di lingue dotate di risorse significative, come il russo, il francese e lo spagnolo; all’altro estremo della scala, si è concentrato anche su alcuni dialetti.
Nuove voci per offrire una maggiore diversità
Lo sviluppo del sistema non è stato privo di difficoltà. «La sfida tecnica principale consisteva nell’integrare i sistemi avanzati di IA in lingue che disponevano di pochi dati digitali», spiega Raudys. L’équipe ha superato questo problema utilizzando testi accentuati, assumendo madrelingua per ottenere un feedback e applicando la ricerca linguistica. «AFE ha risposto alla richiesta artistica di una narrazione naturale ed espressiva addestrando direttamente i modelli di IA con dati vocali caratterizzati da un’apposita espressività», aggiunge. Guardando al futuro, AFE promette di trasformare l’accessibilità e l’inclusività degli audiolibri. «Questo metodo basato sull’IA riduce i costi di produzione di quasi il 60% e fa sì che i tempi di produzione siano di appena un’ora, eliminando spese costose come quelle associate alla narrazione e alla registrazione», osserva Raudys. Inoltre, il progetto va a beneficio degli ascoltatori ipovedenti, sostiene i piccoli editori e aiuta PMI innovative in tutta Europa. Combinando IA e creatività, AFE sta portando nuove voci alle lingue poco servite e sta dando forma a un paesaggio digitale e culturale più inclusivo. «AFE contribuirà a sviluppare condizioni di parità tra le diverse lingue europee», afferma Raudys. Il progetto dimostra come la tecnologia possa potenziare la creatività, preservare la diversità linguistica ed espandere a tutti l’accesso alla letteratura. In seguito al completamento del progetto, AAI Labs intende perfezionare e sviluppare ulteriormente la piattaforma AFE, ampliare il supporto ad altre lingue e dialetti a basse risorse e immettere la tecnologia sul mercato attraverso partenariati con editori e piattaforme di contenuti. Alla luce della crescente domanda globale di audiolibri e contenuti digitali accessibili, la soluzione dispone di un forte potenziale commerciale per aprire nuovi mercati e sostenere al contempo la diversità linguistica in tutto il mondo. Il consorzio, che ha riunito AAI Labs, Bulaja Naklada e Quickfox Publishing, è stato co-finanziato dal programma Orizzonte Europa, dal Consiglio per la ricerca della Lituania (LMT), dall’Agenzia croata per le PMI e gli investimenti (HAMAG-BICRO) e dal Dipartimento per la scienza, la tecnologia e l’innovazione del Sudafrica (DSTI).