Un’applicazione web offre strumenti di analisi del testo per tutti
Gli strumenti di analisi del testo sono impiegati per estrarre dati non strutturati in forma di testo, e trasformarli in informazioni strutturate e concrete. Fra questi si annoverano strumenti per preparare ed elaborare testi, nonché strumenti per analizzare dati derivanti da tale elaborazione. «Questi strumenti sono usati dai ricercatori che gestiscono grandi quantità di informazioni digitali», spiega Kenneth Benoit, coordinatore del progetto QUANTEDA, e professore di scienze sociali comportamentali presso la London School of Economics and Political Science in Gran Bretagna. «Tali informazioni possono essere in forma di documenti storici, letteratura, documenti governativi o post sui social network. Gli strumenti analitici possono essere usati per identificare le differenze nell’uso del linguaggio o per esaminare e valutare le prospettive psicologiche espresse nei testi». Le soluzioni esistenti rientrano generalmente in due categorie, librerie software per programmatori informatici e applicazioni per utente finale che non richiedono alcuna abilità di programmazione. «Mentre le librerie software forniscono estese capacità tecniche, tale potenza è disponibile solo ai programmatori con un alto livello di conoscenze» spiega Benoit. «Il software intuitivo invece offre solo una funzionalità limitata». Benoit si è reso conto che è necessario rendere gli strumenti di analisi del testo disponibili ad un pubblico più ampio: facili da usare, ma con un elevato grado di flessibilità e potenza.
Potente analisi del testo
Il progetto QUANTEDA si prefigge di creare un software open-source al fine di rispondere a tale esigenza. Un precedente progetto finanziato dal Consiglio europeo della ricerca, chiamato QUANTESS, è stato fondamentale per lo sviluppo del back-end dell’applicazione. Benoit ha cercato di basarsi su questo progetto e di sviluppare un prototipo commerciabile che non richieda esperienza di programmazione. Il software recentemente sviluppato si esegue interamente su un server cloud ed è accessibile attraverso un browser web. Ciò significa che la capacità di eseguire potenti analisi di grossi volumi di testo non è limitata dalla capacità hardware dell’utente, rendendolo ancora più accessibile. I componenti dell’interfaccia sono stati poi sviluppati e possono essere facilmente tradotti in una qualsiasi lingua. Il programma può essere creato in una versione hindi, cinese o spagnola, o in qualsiasi lingua in cui possono essere tradotti i menu e le pagine di aiuto. «Abbiamo anche voluto garantire che questa applicazione web fosse alla portata delle tasche degli studenti, dei ricercatori ad inizio carriera e degli utenti dei paesi in via di sviluppo», aggiunge Benoit. «A tal fine, è stata sviluppata una politica di prezzi flessibile che rifletta le possibilità economiche». Benoit fa notare che molte applicazioni online, come Dropbox, GitHub, RStudio e Slack, usano con successo un modello simile.
Strumenti disponibili per tutti
L’applicazione che deriva da quest’ultimo progetto, chiamata Quanteda Guru, è disponibile oggi per la versione di prova o per l’acquisto. «Oltre ai ricercatori accademici, abbiamo identificato altri potenziali utenti che sono ricchi di dati, ma scarsi di informazioni», prosegue Benoit. «Tra questi ricordiamo i professionisti, in particolare gli operatori sanitari, e i dipartimenti governativi come i ministeri della giustizia o della salute». Altri potenziali utenti finali includono l’intelligence aziendale e le società di marketing, che spesso usano i social media, nonché le compagnie di assicurazione. Queste entità hanno bisogno di analizzare e valutare i rapporti di rischio e di incidente. Anche le forze dell’ordine necessitano di analizzare rapporti scritti, mentre il personale di assistenza clienti e i call center spesso devono analizzare e registrare gli eventi. «Attualmente stiamo lavorando per aggiungere nuove funzionalità, migliorare l’esperienza utente e replicare su scala industriale le prestazioni», aggiunge il ricercatore. «La cosa più importante è che questa applicazione si basa su una libreria software open-source. Ciò significa che il codice sorgente del motore di analisi è aperto per essere studiato accuratamente, validato scientificamente e soggetto a continuo sviluppo e miglioramento».
Parole chiave
QUANTEDA, online, web, analisi, testo, storico, software, interfaccia, browser