Risolvere il problema della polisemia
Polisemia significa molteplici significati connessi di una singola parola o frase. Nelle sue forme più sistematiche, questo fenomeno linguistico rispecchia i principi concettuali profondi secondo i quali organizziamo la nostra conoscenza del mondo. Eppure, anche se gli esseri umani elaborano facilmente tali relazioni concettuali, sollevano problemi noti per i sistemi di gestione delle informazioni codificate linguisticamente. Il progetto ODASP (Ontology driven analysis of nominal systematic polysemy in WordNet), finanziato dall’UE, prevede di migliorare il modo in cui le informazioni sul mondo vengono rappresentate e strutturate in modo standard in informatica, vale a dire nelle ontologie computazionali. L’attenzione primaria del progetto è stata posta sulle ontologie costruite dalle categorie e dalle relazioni linguistiche. Il consorzio ha mirato ad affrontare le difficoltà di rappresentazione delle relazioni concettuali alla base della polisemia sistematica in una grande banca dati linguistica on-line di lingua inglese detta WordNet. In particolare, i ricercatori hanno considerato il problema connesso dell’eredità multipla, che è una delle principali fonti del “problema di sovraccarico IS A” (IS A overloading problem). Le metodologie di progetto si sono avvalse dell’ontologia filosofica e della linguistica. Il team ha identificato la percentuale di voci in WordNet interessate da questo problema. I ricercatori hanno ulteriormente proposto soluzioni che comportano un nuovo tipo di relazione semantica in WordNet: la “relazione di costituzione”. Questa soluzione comporta l’arricchimento della struttura di WordNet per rappresentare correttamente concetti complessi, come la formazione di una gerarchia linguistica separata dai concetti semplici standard. Il lavoro ha prodotto una rappresentazione teorica formale della relazione di cui sopra entro un’ontologia di alto livello. La sua mappatura sul livello superiore ristrutturato di WordNet consente nuove inferenze semantiche. L’ontologia proposta evita le limitazioni delle precedenti proposte adottando un approccio dall’alto al basso, sulla base di un’attenta analisi dei vincoli ontologici e dei rapporti alla base della polisemia sistematica. La ricerca ha rivelato il problema della categorizzazione concettuale alla base del fenomeno lessicale di “polisemia nominale intrinseca”. In questo modo, il lavoro ha dimostrato la pertinenza dei risultati del progetto per le ontologie in generale. Il progetto ha facilitato il trasferimento della conoscenza. A livello universitario, ha coinvolto la formazione di uno studente di master in metodi attinenti. Il trasferimento si è verificato anche a livello europeo e internazionale, sotto forma di collaborazioni di ricerca. Al di là del fenomeno linguistico della polisemia, i principi di categorizzazione di ODASP possono trovare applicazione in altri sistemi ontologici, migliorando le loro prestazioni, come sostenuto nel caso di banche dati biomediche.
Parole chiave
Polisemia, analisi, WordNet, costituzione, relazione