Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

Phylogenetic Lexification: Patterns of meaning through time

Descrizione del progetto

Modelli statistici avanzati per tracciare l’evoluzione delle strutture semantiche

Delle circa 7.000 lingue parlate nel mondo, quasi la metà è in pericolo di estinzione, per cui risulta essenziale studiarle al fine di comprendere l’evoluzione e la diversità linguistica. Molte lingue documentate solo da brevi elenchi di parole in genere vengono studiate sulla base di unità linguistiche legate ai suoni, oppure alla funzione grammaticale. La semantica, ovvero l’analisi dei significati delle parole e delle loro relazioni reciproche, costituisce un metodo più complicato, utilizzato raramente in tal ambito. Con il sostegno del programma di azioni Marie Skłodowska-Curie, il progetto PhLex si propone di utilizzare modelli statistici avanzati allo scopo di tracciare l’evoluzione delle strutture semantiche, applicando la «filogenetica» alla «lessificazione» e aprendo la strada alla determinazione della parentela genetica tra le diverse lingue.

Obiettivo

In historical linguistics, scholars often grapple with limited data. Nearly half of the world's ~7,000 languages are endangered. Many of these languages are under-documented, often reduced to mere short wordlists. This is a pressing challenge, as the scarcity hampers our ability to understand linguistic evolution and diversity. Traditional methods often rely on the form of linguistic units, such as phonemes or morphemes. The PhLex project challenges this by emphasising that semantics, while less explored, is not intrinsically unyielding to analysis. PhLex aims to innovate by incorporating semantic analysis into traditional methods, enhancing both our grasp of linguistic evolution, and thus better utilise under-documented language data. To validate this methodology, the PhLex project will focus on the Oceanic language family, spoken across Polynesia, Melanesia, and Micronesia. The first phase involves creating a comprehensive database that explores how these languages articulate concepts related to the semantic domain of perception, like seeing, hearing, and feeling—an area with notable cross-linguistic variation. Subsequent analysis using advanced statistical models traces the historical evolution of the semantic structures, thus applying ‘phylogenetics’ to ‘lexification’, allowing for a comparative assessment against traditional cognate-only methods. The PhLex project’s ultimate objective is to enhance historical linguistic methods by testing a hybrid model that integrates semantic and cognate-based approaches. This model aims to optimise the use of limited linguistic data to provide a nuanced understanding of language origins and evolution. The project thereby opens a new avenue for determining genetic relatedness between languages, an essential factor in understanding linguistic diversification and aiding language preservation efforts in the face of under-documentation.

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.

È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione

Meccanismo di finanziamento

HORIZON-TMA-MSCA-PF-EF -

Coordinatore

ECOLE NORMALE SUPERIEURE
Contributo netto dell'UE
€ 195 914,88
Indirizzo
45, RUE D'ULM
75230 Paris
Francia

Mostra sulla mappa

Regione
Ile-de-France Ile-de-France Paris
Tipo di attività
Istituti di istruzione secondaria o superiore
Collegamenti
Costo totale
Nessun dato

Partner (1)