Description du projet
Des méthodes mathématiques mettent en évidence les relations inédites à l’origine du changement et de l’évolution des langues
Depuis Darwin, les «parallèles curieux» entre l’évolution biologique et l’évolution linguistique sont clairs. Les arbres phylogénétiques mettant en évidence la diversification et la dissémination à partir «d’ancêtres» communs sont tout aussi pertinents pour les études linguistiques modernes que pour la biologie. De même, des méthodes informatiques et statistiques sont appliquées pour mieux comprendre les sources des variations linguistiques entre les langues (variation interlinguistique). Le projet CrossLingference, financé par l’UE, applique des méthodes mathématiques, statistiques, de modélisation et de simulation bien établies, à la variation interlinguistique, dans le but d’améliorer considérablement notre capacité à expliquer les relations et les facteurs de changement.
Objectif
Historical linguistics and linguistic typology share the objective of explaining cross-linguistic variation. Their traditional research agendas have been largely disjoint though since historical linguistics strives for depth and typology for breadth. This tension has been replicated in current statistical and computational renderings of two sub-disciplines. Computational models of language change generally focus on individual language families, while statistical typology pays little attention to diachronic processes. CrossLingference will bridge this gap. Using Bayesian hierarchical models, the reach of modern phylogenetic linguistics will be extended to cross-family models, where each lineage is assumed to follow its own dynamics, but cross-family variation is constrained and data from one family are used to make inference about the processes in other families. At the same time, state-of-the-art generalized linear mixed models will be extended to control both for genealogical history and language contact. These model-based approaches will be complemented by agent-based simulations.
CrossLingference will implement this general programme for the following domains of application, securing a lasting impact both on statistical typology and on computational historical linguistics:
- Sound laws in language change, enabling automatic reconstruction of proto-language vocabulary,
- Causal relationships between typological variables.
- Factoring of universal tendencies, historical contingencies and language contact in explaining variation in
word-order types and inflectional paradigms.
Champ scientifique (EuroSciVoc)
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN.
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN.
Mots‑clés
Programme(s)
Thème(s)
Régime de financement
ERC-ADG - Advanced GrantInstitution d’accueil
72074 Tuebingen
Allemagne