Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Linking Synchronic and Diachronic Analysis of Paradigms

Description du projet

Des outils informatiques pour comprendre les inflexions

Les inflexions sont des changements dans la forme ou la terminaison d’un mot, comme les changements de temps ou de personne dans les verbes. Les locuteurs de langues à flexion très irrégulière peuvent généralement produire toutes les formes de groupes de mots, même avec des données incomplètes. Avec le soutien du programme Actions Marie Skłodowska-Curie, le projet LSDAP vise à tirer parti de nouvelles méthodes quantitatives, notamment les modèles bayésiens et la théorie de l’information et des ensembles, pour étudier les changements paradigmatiques, en se concentrant sur les verbes romans. LSDAP développera un logiciel qui appliquera automatiquement des ensembles de changements sonores ordonnés à de vastes lexiques de flexions. Les formes attendues qui en découlent seront comparées aux formes réelles afin d’explorer les meilleurs prédicteurs du changement analogique.

Objectif

Speakers of even highly irregular inflecting languages can usually produce all forms of all lexemes (e.g. do, does, did). How they can do so on the evidence of skewed and partial input is known as the Paradigm Cell Filling Problem. The increased availability of large inflected lexicons, and computing power and tools to assess cell-to-cell predictive uncertainty have enabled us in recent years to automatically measure multiple aspects of paradigm complexity and structural similarity. Unfortunately, this quantitative turn in morphology has been almost entirely limited to synchronic analyses. This project seeks to harness the power of novel quantitative methods (e.g. Information and Set Theory, Bayesian models) for the study of paradigmatic change as well. The focus will be on Romance verbs, as the most historically documented and best-understood inflectional system worldwide.

Regarding synchronic variability, I will integrate the best and largest extant inflected lexicons in the family (5000+ complete verbs for the 5 largest Romance languages and Latin). All forms will be annotated for lemma-level and cell-level cognacy to produce a reusable and expandable pan-Romance etymological inflected lexicon. Turning to diachrony, one of the greatest obstacles to analyzing morphological change is distinguishing it from regular sound change. Given the large number of words and changes it is impossible to derive an optimal chronology of sound changes by hand. I will therefore write software that applies sets of ordered sound changes automatically to large inflected lexicons (e.g. of Latin) to derive expected forms. Comparing these to actual forms will reveal where morphological changes have occurred historically and enable us to explore what the best predictors are of analogical change: frequency, predictability, meaning, etc. This will allow us to evaluate more tractably competing hypotheses of phonological and morphological change and trends of change.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Coordinateur

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE CNRS
Contribution nette de l'UE
€ 211 754,88
Coût total
Aucune donnée

Partenaires (1)