Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

Article Category

Contenuto archiviato il 2023-03-02

Article available in the following languages:

Nuovo stumento per il controllo qualità delle banche dati delle proteine

Le banche dati pubbliche continuano a contenere geni e proteine anomali, incompleti e pronosticati male, nonostante gli sforzi fatti recentemente per migliorare la registrazione computerizzata dei genomi. Questi errori influiscono negativamente sull'affidabilità delle banche d...

Le banche dati pubbliche continuano a contenere geni e proteine anomali, incompleti e pronosticati male, nonostante gli sforzi fatti recentemente per migliorare la registrazione computerizzata dei genomi. Questi errori influiscono negativamente sull'affidabilità delle banche dati. Ora un team di ricercatori ha sviluppato un nuovo strumento che offre la possibilità di un efficiente controllo della qualità delle banche dati: il "MisPred". Il lavoro, recentemente pubblicato sulla rivista ad accesso libero BMC Bioinformatics, è stato compiuto come parte del progetto dell'UE BioSapiens, sostenuto con un finanziamento di 12 Mio EUR nell'ambito dell'area tematica "Scienze della vita, genomica e biotecnologia per la salute" del Sesto programma quadro (6°PQ). Il team di ricerca ha dichiarato che lo strumento MisPred usa quattro "procedure" per individuare inserzioni sospettate di essere anomali, incomplete o pronosticate male, sulla base logica che una sequenza sarà probabilmente sbagliata se alcuni suoi aspetti non corrispondono alla conoscenza che si possiede sui geni protein-coding e sulle proteine: (1) le proteine extracellulari o transmembrane devono possedere segnali secretivi appropriati, (2) sulla proteina deve trovarsi un segmento transmembrana con parti intra e extracellulari, (3) in un'unica proteina non devono essere presenti campi extracellulari e nucleari, (4) il numero dei residui degli aminoacidi appartenenti a membri tra loro strettamente collegati di un campo globulare familiare, devono cadere in un range relativamente ristretto, e (5) una proteina deve essere codificata attraverso gli essoni collocati su un unico cromosoma. Il team è stato guidato dal professor Lásló Patthy, ricercatore all'istituto per l'enzimologia dell'Accademia delle scienze ungherese. "Studi recenti hanno dimostrato che una quantità significativa di geni eucariotici sono pronosticati male a livello della trascrizione," ha detto il professor Patthy. "Dato che le procedure del MisPred sono in grado di individuare questi errori e potrebbero aiutare nella loro correzione, riteniamo che lo strumento potrebbe migliorare notevolmente la qualità dei dati della sequenza della proteina basati sulla previsione dei geni." Tuttavia, il professor Patthy ha fatto notare che una serie di proteine secrete potrebbero effettivamente "non possedere i segnali secretori dei peptidi, perché soggetti a secrezione proteica non guidata". Il membro dell'istituto ha aggiunto: "Analogamente, attualmente non si può escludere che le chimere transcromosomiali possano essere formate e avere funzioni fisiologiche normali. Tuttavia, il fatto che l'analisi MisPred della sequenza proteica della banca dati Swiss-Prot abbia individuato pochissime eccezioni di questo tipo, indica che le regole di MisPred sono valide in generale." La ricerca ha mostrato che la maggior parte delle previsioni sbagliate avvengono a causa dell'assenza dei segnali peptidici previsti e della violazione dell'integrità del campo. "È interessante notare che anche una banca dati mantenuta manualmente come UniProtKB/Swiss-Prot, è contaminata da proteine pronosticate male o anomali, anche se molto meno dei dati EnsEMBL o GNOMON," ha detto il team. Secondo loro, l'approccio MisPred offrirà ai ricercatori più tempo per effettuare ulteriori studi sui geni identificati male.

Articoli correlati

Il mio fascicolo 0 0