Reconstruire des génomes microbiens à partir de l’environnement
Les communautés de microbes sont partout, de l’environnement à notre propre corps. Les microbiomes humains et environnementaux sont diversifiés et jouent différents rôles clés dans la santé humaine et dans le fonctionnement d’écosystèmes sains. Grâce à l’avènement récent de la métagénomique, une technologie de séquençage de l’ADN efficace et rentable, nos connaissances sur ces communautés se sont considérablement accrues ces dernières années. En fait, la recherche sur le microbiome s’est accélérée (pour en savoir plus, consultez ce récent épisode du podcast CORDIScovery, «Le monde fascinant du microbiome intestinal»). Les génomes assemblés par métagénome (MAG pour «metagenome-assembled genomes») reconstruits grâce à ces techniques sont extrêmement précieux pour approfondir notre compréhension des différentes niches écologiques des microbes, ce qui pourrait avoir un large éventail d’applications dans les domaines de la biotechnologie, de la médecine et même de la science du climat. Cependant, la qualité des MAG reconstruits repose sur une technique connue sous le nom de «binning» (groupement par classe), qui consiste à placer des groupes de séquences nucléotidiques d’un organisme dans des «bins» (classes) en fonction de leur fréquence d’apparition dans différents échantillons. S’il n’y a pas beaucoup d’échantillons d’un organisme particulier, le regroupement devient plus difficile, et la reconstruction est médiocre. Dans le cadre du projet Metagenome binning, financé par l’UE, entrepris avec le soutien du programme Actions Marie Skłodowska-Curie(s’ouvre dans une nouvelle fenêtre), les chercheurs entendaient relever ces défis en développant un nouvel algorithme pour améliorer le «binning» dans les situations où les échantillons sont rares. Ces travaux aideront les scientifiques à mieux comprendre les microbiomes humains et environnementaux. «L’amélioration du “binning” permet de mieux reconstruire des génomes microbiens de haute qualité à partir d’échantillons environnementaux, par exemple de l’intestin humain», explique Yazhini Arangasamy(s’ouvre dans une nouvelle fenêtre), chercheur postdoctoral Marie-Curie à l’Institut Max-Planck de sciences multidisciplinaires(s’ouvre dans une nouvelle fenêtre).
Créer un nouvel algorithme de regroupement du métagénomes
Dans le cadre de ce projet, Yazhini Arangasamy a développé un nouvel algorithme de classement métagénomique afin de relever ces défis et a procédé à une évaluation comparative approfondie des méthodes de classement. Le projet s’est appuyé sur de nouvelles techniques d’apprentissage profond pour créer le nouvel algorithme. Les résultats démontrent que les outils d’apprentissage profond utilisant des modèles contrastifs représentent l’état de l’art pour le binning du métagénome. Ces modèles extraient des informations pertinentes en comparant entre elles des paires de séquences de nucléotides. Les chercheurs ont également constaté, et c’est important, que le choix de la stratégie de regroupement a le plus grand impact sur la récupération de génomes de haute qualité de microbes de faible abondance et de souches similaires. «Le choix de la stratégie de binning doit dépendre de la profondeur de séquençage des échantillons, de la complexité des souches et de la couverture de lecture des génomes dans les échantillons de métagénome», explique Yazhini Arangasamy. Un nouvel outil développé dans le cadre du projet, MAGmax(s’ouvre dans une nouvelle fenêtre), permet d’améliorer la récupération de génomes de haute qualité par l’intégration de bins provenant de plusieurs échantillons.
Contribuer à la découverte de nouvelles souches microbiennes
Yazhini Arangasamy et son équipe espèrent que ces résultats profiteront à l’ensemble de la communauté scientifique en aidant les spécialistes du métagénome à optimiser les pipelines bio-informatiques pour les études à grande échelle sur le microbiome. À terme, cela permettra de mieux comprendre les microbiomes et leurs liens avec la santé humaine et le fonctionnement des écosystèmes. «Les informations génomiques complètes des métagénomes sont essentielles pour comprendre l’influence métabolique des micro-organismes sur la santé humaine et le fonctionnement des écosystèmes», ajoute Yazhini Arangasamy. «Il facilite la découverte de nouvelles protéines issues de microbes non cultivables, de groupes de gènes uniques et de nouvelles souches présentant un potentiel pour les interventions biotechnologiques.» Yazhini Arangasamy va à présent appliquer les enseignements tirés du projet pour générer des génomes de haute qualité à partir d’échantillons de métagénome humain, découvrir de nouvelles protéines microbiennes et étudier leurs fonctions à l’aide d’expériences en laboratoire humide.