Un système de mise en corrélation entre modèles génétiques et données environnementales bientôt développé dans le cadre d'un projet européen
Lancé récemment, le projet METAFUNCTIONS vise à développer un système d'exploration de données permettant la mise en corrélation de modèles génétiques identifiés dans des génomes et des métagénomes et de données portant sur le contexte environnemental. Le déchiffrage du plan génétique de toutes les espèces microbiennes pourrait indiquer aux scientifiques quelles espèces sont présentes dans tel ou tel environnement et comment elles interopèrent, leur permettant de découvrir des milliers de micro-organismes inconnus jusque lors, ainsi que de nouvelles enzymes et protéines susceptibles d'être utilisées à des fins médicales et industrielles et des moyens de mobiliser les bactéries pour lutter contre la pollution. Déterminer la séquence ADN complète d'une espèce en particulier est devenu quelque chose de courant - on l'a fait pour l'homme, la souris, le riz et de nombreux micro-organismes. Au cours des sept dernières années, plus de 260 génomes microbiens ont été séquencés avec succès, et le séquençage de 600 autres est actuellement en cours. Les chercheurs savent que jusqu'à 99 pour cent des micro-organismes ne peuvent être étudiés en utilisant les méthodes traditionnelles d'extraction de l'ADN. Il est cependant possible d'extraire l'ADN d'un échantillon de sol ou d'eau de mer. Accéder à cette diversité cachée impose de recourir à de nouvelles techniques. Ces techniques ont pour vocation de lire tout l'ADN des milieux bactériens rencontrés dans une parcelle de sol ou d'eau de mer, ou même sur la paroi de l'intestin humain. Les séquences de ces échantillons sont appelées métagénomes - puisqu'on n'a pas affaire ici au génome d'un organisme, mais au plan génétique d'un environnement en particulier. Le fond de ces méthodes consiste à extraire l'ADN d'un environnement donné puis à insérer un fragment de cet ADN dans un plasmide d'expression pour créer une librairie "métagénomique". L'étape finale consiste à étudier fonctionnellement l'ADN exprimé au regard d'une multitude d'activités. Des myriades d'informations ayant trait aux métagénomes sont ainsi engendrées, mais on manque sérieusement d'outils d'analyse. La tâche est ardue: il peut y avoir des milliers d'espèces microbiennes différentes dans une cuillère de sol ou d'eau de mer, ce qui signifie que, d'un point de vue génétique, un tel échantillon peut présenter une complexité supérieure à celle du génome humain. En outre, la recherche en métagénomique s'est jusqu'à présent largement concentrée sur les bactéries importantes sur le plan médical, alors que les organismes "éco-pertinents" (ceux impliqués dans la production et la consommation de méthane par exemple) n'ont pas suscité le même intérêt. Financé par la Commission européenne au titre de la priorité NEST (Nouvelles sciences et technologies émergentes) du Sixième programme-cadre (6e PC), le projet METAFUNCTIONS a pour but de relever ces défis en développant un nouveau système d'exploration de données capable d'identifier les relations entre des gènes séquencés et leur contexte environnemental et écologique. Coordonné par l'Institut Max Planck de microbiologie marine (Allemagne), le projet intègre toute une panoplie d'expertise en bio-informatique, informatique, systèmes d'information géographique et sciences marines de quatre centres européens de recherche situés en Allemagne, en Suisse et en Pologne. Ce projet, dont l'intitulé officiel est "environmental- and metagenomics - a bioinformatics system to detect and assign functions to habitat-specific gene patterns" (génomique environnementale et métagénomique - système bio-informatique de détection et d'attribution de fonctions aux modèles génétiques liés à un habitat spécifique), a pour objectif ultime de déterminer la fonction de gènes inconnus à ce jour, appelés "gènes hypothétiques". Ce mariage innovant de compétences pourrait permettre de développer une technologie aux vastes applications et aux retombées financières potentielles élevées. Le "Genomes MapServer" (serveur de cartographie du génome) édifié dans le cadre de ce projet permettra bientôt aux scientifiques du monde entier d'accéder à des données intégrées dans le domaine du génome et de l'écologie et de visualiser clairement les résultats de leurs analyses. METAFUNCTIONS utilise les techniques de traitement du langage naturel pour assembler des données issues de la "littérature" et les convertir en un format base de données structuré. Le projet s'appuie également fortement sur des techniques d'exploration de données pour identifier des modèles nouveaux ou intéressants parmi les données génomiques. Un autre aspect innovant de ce projet tient à l'utilisation de systèmes d'information géographique (SIG). Les outils "SIG" permettent de simuler et d'analyser des événements d'un point de vue géographique ou spatial. Les modèles nouveaux - l'agrégation physique des gènes au sein d'un génome par exemple - seront corrélés aux données concernant l'habitat contextuel. Imaginons par exemple qu'un agrégat particulier de gènes soit trouvé dans plusieurs génomes et métagénomes, tous prélevés dans des environnements à haute température: il serait raisonnable de déduire que le gène doit jouer un rôle dans le fait de permettre la vie à une chaleur extrême. Le projet METAFUNCTIONS permettra en particulier de faire avancer considérablement le travail en attente dans l'attribution d'une fonction à la multitude de gènes hypothétiques conservés que le séquençage génomique à haut débit a produits. L'écologie marine, les biotechnologies, la médecine et de nombreux secteurs industriels pourraient tous bénéficier des services de cartographie que METAFUNCTIONS va fournir à la génomique écologique. Les retombées financières potentielles du projet sont immenses: les bactéries constituent plus de la moitié de la matière vivante sur Terre, et jouent des rôles essentiels dans nombre de cycles environnementaux. Elles transforment l'azote de l'air en une forme utilisable par les plantes, produisent plus de la moitié de l'oxygène planétaire, brisent les minéraux et absorbent la pollution.