Skip to main content

Machine learning for quantitative modelling of structured phenotypes

Article Category

Article available in the folowing languages:

La modélisation des interactions génotype-phénotype

L'objectif prioritaire des études génétiques passe par l'identification des mutations pathogènes et des mécanismes par lesquels elles conduisent à la maladie. Des chercheurs européens y ont contribué en générant des modèles statistiques multivariés.

Santé

Les différences génétiques entre individus se traduisent par des différences phénotypiques. Par contre, la plupart des phénotypes pathologiques n'émergent pas en raison d'un seul gène ou d'une seule protéine mais sont plutôt le résultat d'un réseau d'interactions moléculaires. Chaque variable de phénotype influence souvent une autre variable puis une autre, générant par conséquent un effet domino qui exige une modélisation capable d'en révéler les véritables relations causales. Pour aborder cette question, les chercheurs du projet MLPHENOM («Machine learning for quantitative modelling of structured phenotypes»), financé par l'UE, ont proposé de développer des méthodes statistiques et computationnelles susceptibles d'interpréter les interactions génotype phénotype. Ces méthodes demandent l'analyse répétée du même phénotype au fil du temps, d'images numériques et de réseaux impliqués dans un phénotype particulier. Dans cette optique, le consortium a utilisé les techniques d'apprentissage automatique pour modéliser les aspects temporels, de réseaux et d'images du phénotype. Les méthodes d'apprentissage automatique extraient certaines propriétés des images et les utilisent comme traits phénotypiques quantitatifs complétant en cela les mesures classiques. Le cadre statistique généré au cours du projet MLPHENOM est ainsi capable de prendre en compte des centaines de mesures individuelles pour l'analyse des réseaux phénotypiques. Cette capacité permet aux chercheurs d'aborder différents aspects de la structure phénotypique et même de détecter l'implication potentielle de facteurs environnementaux. Des modèles complémentaires ont permis la stratification d'évènements moléculaires individuels menant du génotype au phénotype. Le système modèle du projet jette ainsi les bases d'une analyse génétique capable d'appréhender un grand nombre de phénotypes complexes à l'avenir. Cette stratégie de modélisation devrait pouvoir s'appliquer dans un grand nombre de domaines, spécialement dans la recherche biomédicale.

Mots‑clés

Génotype, phénotype, études génétiques, maladie, modèle statistique multivarié, interactions moléculaires, apprentissage machine, modélisation quantitative, phénotypes structurés, recherche biomédicale

Découvrir d’autres articles du même domaine d’application