Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-06-18
Algorithms and Tools for Mining Biological Sequence Data

Article Category

Article available in the following languages:

Des algorithmes pour analyser les séquences d'acides nucléiques

La bioinformatique utilise des logiciels pour analyser des données biologiques complexes. Grâce à de meilleures méthodes de traitement des données de séquences d'acides nucléiques et de protéines, elle va au-delà des limitations actuelles et facilite le séquençage.

L'informatique a révolutionné la façon d'aborder les problèmes complexes, dans des domaines aussi variés que l'automatisation industrielle, la mécanique quantique et la médecine. La bioinformatique cherche à trouver comment relier les informations génétiques (les séquences d'acides nucléiques ou de protéines) avec le phénotype (les caractéristiques observables, symptômes ou dysfonctions). Le projet ALMOND (Algorithms and tools for mining biological sequence data), financé par l'UE, a été lancé pour mettre au point de nouvelles techniques visant des problèmes importants en biologie moléculaire informatisée. Sa méthodologie a mis en avant des méthodes de programmation dynamique qui déterminent des «sous-problèmes» plus simples d'un problème difficile, des modèles récurrents qui les relient, et les solutions de ces cas de base. Les chercheurs d'ALMOND ont développé de nouveaux algorithmes efficaces pour comparer les séquences de protéines. Ils ont défini une nouvelle variante du problème d'alignement de séquence sous contrainte de chemin, dans laquelle la contrainte est donnée sous forme d'une expression régulière (SA-REPC). Les chercheurs ont proposé deux nouvelles solutions à ce problème d'analyse de séquences, disponibles en téléchargement sur le site web du groupe hôte(s’ouvre dans une nouvelle fenêtre). Les scientifiques ont aussi développé de nouveaux algorithmes pour comparer des séquences et des structures d'ARN lorsque ces séquences sont dans une région codante, ce qui est fréquent chez les virus et les bactéries. Ces méthodes permettent de prévoir l'ancêtre commun le plus probable entre deux ARN, dépassant les limitations des algorithmes usuels. Plusieurs algorithmes visaient les problèmes de la nouvelle génération de séquençage (NGS). La première étape de nombreuses méthodes d'analyse des données NGS consiste à faire correspondre de courtes lectures avec un génome de référence. Les nouvelles méthodes de mise en correspondance sont notablement plus performantes que les algorithmes précédents. En outre, une nouvelle structure de données pour un graphique servant à la plupart des méthodes pratiques d'assemblage du génome pour des données NGS a surmonté un obstacle majeur dans le traitement informatique de ces données. Son gain de 30 à 40 % de la place mémoire est maintenant utilisé dans des logiciels tiers (Minia). Le projet ALMOND a fourni de nouveaux algorithmes importants, dépassant les limitations des outils actuels destinés à la bioinformatique et à l'analyse de séquences. Ces résultats ont été diffusés largement et le projet s'est traduit par de nouvelles collaborations entre la France et Israël. Le projet devrait donc avoir un impact de longue durée sur la bioinformatique, un domaine important au niveau socioéconomique.

Découvrir d’autres articles du même domaine d’application

Mon livret 0 0