European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Comparative Genomics and Next Generation Sequencing

Article Category

Article available in the following languages:

Une analyse génétique massive

Le volume de données générées par le séquençage génétique est devenu extraordinaire, il est maintenant près de 10 000 fois plus important qu'il y a encore quelques années. La recherche de l'UE a développé une suite logicielle qui permet d'analyser ces énormes quantités de données brutes.

Santé icon Santé

La régulation des gènes est la clé qui nous permet de comprendre comment notre organisme traduit son génome en cellules et en organes complètement fonctionnels. L'expression des gènes dépend des sites de liaison des facteurs de transcription (TFBS); les sites génomiques sur lesquels se lient les protéines régulatrices. Le projet COGANGS («Comparative genomics and next generation sequencing»), financé par l'UE, a développé de nouveaux outils capables de réaliser une analyse de la régulation génétique en se basant sur une collection de motifs connus de séquences ADN et de profils ADN récurrents. La moteur COGANGS améliore significativement la capacité de prédiction de tous les sites TFB importants. Construit par intégration d'un outil de ligne de commande autonome appelé TransFoot (qui implémente les algorithmes) et du bureau CLC Génomics Workbench, cet environnement fournit des interfaces graphiques conviviales. Une interface web appelée Match Portal élargit le système BIOBASE’s ExPlain™ qui identifie les facteurs de transcription et prédit le profil d'expression des gènes. En associant ces deux approches, le système COGANGS est capable de confirmer les TFBS déjà connus et de prédire les sites de liaisons potentiels. Le logiciel est modulable en fonction des besoins des utilisateurs. Cette prédiction peut résulter d'une seule ou de plusieurs séquences de gènes et toutes les connaissances antérieures, évolutionnaires par exemple, peuvent être intégrées dans l'analyse. L'utilisateur peut de plus choisir entre une analyse grossière plus rapide et une analyse extrêmement précise qui demandera plus de temps. Le système utilise la segmentation phylogénétique dans laquelle les intrants de l'arbre évolutionnaire peuvent être segmentés en un certain nombre de petits fragments se chevauchant. Les prévisions de la séquence analysée sont par conséquent reliées à l'ensemble de l'arbre phylogénétique et pas seulement à celles contenant le même composant. Pour les cas les plus simples pour lesquels il n'existe pas d'information évolutionnaire, le Match Portal applique cependant des algorithmes moins sophistiqués mais plus rapides. Ce logiciel est d'une immense valeur pour la recherche pharmaceutique, la biotechnologie, l'agriculture, les compagnies travaillant sur les biocombustibles ou la recherche hospitalière. Le potentiel commercial est gigantesque, la régulation génétique constituant aujourd'hui le composant essentiel dans de nombreux domaines de recherche. Après plusieurs investissements sur le matériel et la consommation énergétique, la valeur commerciale prévue est estimée à au moins 100 millions de dollars de vente par année. Les partenaires du projet ont l'intention de continuer à développer et à améliorer ce logiciel.

Mots‑clés

Suite logicielle, régulation des gènes, analyse, site de liaison des facteurs de transcription, TransFoot, Match Portal, système COGANGS

Découvrir d’autres articles du même domaine d’application