Resi disponibili i database della proteomica
L’oggetto studiato dalla proteomica è il proteoma, l’intero insieme delle proteine prodotte da un organismo nella sua complessità. Per comprendere la biologia di una singola proteina nell’ambiente cellulare, è necessario conoscere le molecole con cui interagisce. I dati sull’interazione delle proteine si ottengono con molti metodi diversi. La raccolta di tali informazioni costituisce il lavoro inserito in molti database di interazioni già esistenti. Il consorzio “International Molecular Exchange” (IMEx) ha ottimizzato i servizi che tali database forniscono alla comunità. Ha introdotto la curation gestita, per produrre un unico dataset privo di duplicazioni, annotato in modo coerente rispetto a uno standard uniformemente elevato. Recentemente, il progetto PSIMEX (Proteomics standards international molecular exchange - systematic capture of published molecular interaction data), finanziato dall’UE, ha proceduto alla fase successiva, trasferendo l’IMEx dalla modalità esplorativa alla produzione piena. PSIMEX ha sviluppato un portale per poter accedere a dati aggregati sulle interazioni delle proteine, archiviati in database sparsi in tutta Europa. A fine agosto 2013, IMEx comprendeva dieci database, fornendo 284 402 interazioni disponibili tratte da 8 067 pubblicazioni. Il database centrale IMEx ha attribuito identificatori univoci a ciascuna pubblicazione. Un sofisticato strumento per la gestione dei dati online, per renderli riutilizzabili e archiviabili (curation), permette a nuove risorse di eseguire una curation di livello IMEx direttamente in IntAct: un database di interazione molecolare open source usato da PSIMEX. Tutti i dati sono accessibili nel sito Web centrale o a livello locale, presso i siti Web di database dei membri. I dati e il software sono tutti liberamente disponibili per la comunità scientifica, da utilizzare su licenza di attribuzione Creative Commons. PSIMEX ha anche sostenuto una serie di laboratori di studio, per insegnare ai partecipanti come utilizzare i dati nell’analisi di rete su larga scala. I moduli didattici on line, i tutorial e le istruzioni per i nuovi utenti forniscono le indicazioni necessarie. La migliore accessibilità a dati di proteomica attraverso PSIMEX sarà molto utile per la salute pubblica e l’agricoltura europea, favorendo inoltre lo sviluppo di nuove sostanze farmaceutiche, bioceutiche e pesticidi.
Parole chiave
Proteomica, database, molecolare, curation, pubblicazione