Les bases de données protéomiques plus accessibles
L'étude du protéome, l'ensemble des protéines dans toute leur complexité, produites par un organisme est le sujet même de la protéomique. Pour comprendre la biologie d'une protéine unique au sein de son environnement cellulaire, il est nécessaire de connaître les molécules avec lesquelles elle interagit. Les données concernant ces interactions moléculaires peuvent être générées par de nombreuses méthodes différentes. La compilation de ces informations constitue le travail des nombreuses bases de données interactives en activité aujourd'hui. Le consortium «International Molecular Exchange» (IMEx) a optimisé les services que ces bases de données fournissent à la communauté scientifique. Il a introduit un système de conservation susceptible de produire un ensemble de données unique et non redondant, régulièrement annoté de manière homogène afin d'obtenir un standard de qualité uniforme. Récemment, le projet PSIMEX (Proteomics standards international molecular exchange - systematic capture of published molecular interaction data), financé par l'UE, a franchi une nouvelle étape en transformant le processus exploratoire IMEx en un système totalement fonctionnel. Les partenaires du projet ont développé un portail permettant d'accéder aux données agrégées sur les interactions protéiques stockées dans les différentes bases de données européennes. Fin août 2013, IMEx gérait dix bases de données représentant pas moins de 284 402 interactions collectées à partir de 8 067 publications scientifiques. La base de données centrale IMEx a affecté un identificateur unique à chaque publication. Un outil sophistiqué de conservation s'appuyant sur la puissance du web permet aux nouvelles ressources de réaliser une curation de type IMEx dans le cadre d'une session d'Intact: une base de données en open source sur les interactions moléculaires. Toutes les données sont accessibles soit à partir du site principal, soit localement, sur les sites des bases de données participantes. Toute les données et logiciels sont disponibles gratuitement pour la communauté scientifique dans le cadre d'une licence 'Creative Commons'. Les partenaires du projet ont également organisé une série d'ateliers afin de former les participants à l'emploi de données dans le cadre d'une analyse de réseau à grande échelle. Modules de formation en ligne, didacticiels et instructions pour les nouveaux usagers apportent les connaissances nécessaires. L'accessibilité accrue des données protéomiques grâce à PSIMEX bénéficiera tant à la santé publique qu'à l'agriculture européenne en facilitant le développement de nouveaux produits pharmaceutiques, de nouveaux composés biologiques actifs et de nouveaux produits phytosanitaires.
Mots‑clés
Protéomique, base de données, moléculaire, conservation, publication