Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

Les modèles d'apprentissage automatique des bébés apprenant la phonologie

Les enfants semblent disposer d'un système d'apprentissage extraordinaire et très efficace qui leur permet d'acquérir le langage et la nature des représentations des sons et des mots dans leur lexique mental. Un projet financé par l'UE a fait des percées significatives dans le domaine de l'exploration du système d'acquisition de la langue complexe à l'aide de méthodes d'analyse avancées.
Les modèles d'apprentissage automatique des bébés apprenant la phonologie
Les bébés commencent l'apprentissage de la phonotactique à un âge très précoce; quelques mois après la naissance, ils sont sensibilisés à certaines propriétés qui distinguent les langues l'une de l'autre. Les nourrissons de 9 mois peuvent distinguer les séquences de sons qui obéissent à la phonotactique de leur langue de ceux qui ne le font pas. Ils peuvent également distinguer les séquences qui sont fréquentes des autres qui sont peu fréquentes mais légales au niveau phonotactique.

Selon le modèle d'apprentissage basé sur les erreurs, l'apprenant maintient une hypothèse actuelle de la phonotactique de l'adulte et continue à mettre à jour légèrement cette hypothèse chaque fois qu'il commet une erreur au niveau du flux de données entrant. Même si ce modèle d'apprentissage a été approuvé par la théorie d'optimalité en raison de sa plausibilité cognitive, il manque encore un modèle de calcul qui décrit avec précision l'apprentissage basé sur les erreurs.

Le projet MODACQUPHON (Modeling the acquisition of phonotactics), financé par l'UE, a produit des résultats significatifs soutenant l'hypothèse de la recherche fournie par l'apprentissage basé sur les erreurs dans la phonologie basée sur les contraintes.

Les travaux ont touché différentes questions de phonologie computationnelle. La première concernait la cohérence et la convergence. Les scientifiques ont étudié si la phonotactique apprise par le modèle d'apprentissage axé sur les erreurs est compatible avec les données d'apprentissage et si, à terme, le modèle cesse de faire des erreurs et s'installe sur une grammaire finale.

Un autre ensemble de résultats a abordé une question plus difficile que la cohérence, à savoir l'exactitude. L'objectif était de savoir si le modèle établit une distinction entre les sons et les combinaisons de sons licites et illicites et apprend à exclure les formes illicites comme dans le langage adulte cible – en d'autres termes, si la grammaire finale capte la phonotactique adulte. Les propriétés phonologiques pertinentes sont extraites par un ensemble de contraintes universelles qui mesurent comment les structures phonologiques dévient des contraintes idéales de marquage et de fidélité. Les scientifiques ont mis en place le premier ensemble de conditions suffisantes pour l'exactitude pour une catégorie de schémas phonotactiques cibles caractérisés par la propriété selon laquelle le classement relatif des contraintes de fidélité contribue à la distinction entre les formes licites et illicites.

L'équipe a également soutenu que le modèle d'apprentissage basé sur les erreurs ne décrit pas suffisamment l'acquisition de la phonotactique par l'enfant à moins qu'il n'y ait aussi des restrictions au niveau des contraintes de fidélité.

Les nourrissons acquièrent la phonotactique à un stade où ils n'ont pas encore accès à des altérations phonologiques. Les scientifiques ont affirmé que la force d'un modèle basé sur les erreurs est qu'il est formé sur des formes de surface uniquement et ne requiert donc pas d'informations sur les formes sous-jacentes, fournissant de la sorte une explication à l'énigme de savoir comment la phonotactique peut être acquise avant la conscience morphologique.

MODACQUPHON a été consacré à prouver que l'apprentissage basé sur les erreurs était un modèle correct d'acquisition par les enfants de la phonotactique, tant d'un point de vue computationnel que de modélisation. Les résultats du projet ont été diffusés dans de nombreuses publications académiques.

Informations connexes

Mots-clés

Apprentissage machine, bébés, acquisition du langage, phonotactique, apprentissage piloté par des erreurs, MODACQUPHON