Skip to main content
European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Cross-Linguistic statistical inference using hierarchical Bayesian models

Description du projet

Des méthodes mathématiques mettent en évidence les relations inédites à l’origine du changement et de l’évolution des langues

Depuis Darwin, les «parallèles curieux» entre l’évolution biologique et l’évolution linguistique sont clairs. Les arbres phylogénétiques mettant en évidence la diversification et la dissémination à partir «d’ancêtres» communs sont tout aussi pertinents pour les études linguistiques modernes que pour la biologie. De même, des méthodes informatiques et statistiques sont appliquées pour mieux comprendre les sources des variations linguistiques entre les langues (variation interlinguistique). Le projet CrossLingference, financé par l’UE, applique des méthodes mathématiques, statistiques, de modélisation et de simulation bien établies, à la variation interlinguistique, dans le but d’améliorer considérablement notre capacité à expliquer les relations et les facteurs de changement.

Objectif

Historical linguistics and linguistic typology share the objective of explaining cross-linguistic variation. Their traditional research agendas have been largely disjoint though since historical linguistics strives for depth and typology for breadth. This tension has been replicated in current statistical and computational renderings of two sub-disciplines. Computational models of language change generally focus on individual language families, while statistical typology pays little attention to diachronic processes. CrossLingference will bridge this gap. Using Bayesian hierarchical models, the reach of modern phylogenetic linguistics will be extended to cross-family models, where each lineage is assumed to follow its own dynamics, but cross-family variation is constrained and data from one family are used to make inference about the processes in other families. At the same time, state-of-the-art generalized linear mixed models will be extended to control both for genealogical history and language contact. These model-based approaches will be complemented by agent-based simulations.
CrossLingference will implement this general programme for the following domains of application, securing a lasting impact both on statistical typology and on computational historical linguistics:
- Sound laws in language change, enabling automatic reconstruction of proto-language vocabulary,
- Causal relationships between typological variables.
- Factoring of universal tendencies, historical contingencies and language contact in explaining variation in
word-order types and inflectional paradigms.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN.

Régime de financement

ERC-ADG - Advanced Grant

Institution d’accueil

EBERHARD KARLS UNIVERSITAET TUEBINGEN
Contribution nette de l'UE
€ 2 500 000,00
Adresse
GESCHWISTER-SCHOLL-PLATZ
72074 Tuebingen
Allemagne

Voir sur la carte

Région
Baden-Württemberg Tübingen Tübingen, Landkreis
Type d’activité
Higher or Secondary Education Establishments
Liens
Coût total
€ 2 500 000,00

Bénéficiaires (1)