Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Understanding the Language of Life: Identifying and Characterizing the Language Units in Protein Sequences

Descrizione del progetto

Comprendere le sequenze delle proteine

Le proteine, fondamentali per la vita, possono essere rappresentate testualmente come sequenze di aminoacidi. Anche se il «linguaggio della vita» non è stato ancora del tutto compreso, i progressi nello studio delle proteine sono stati resi possibili dall’elaborazione del linguaggio naturale. Il progetto LifeLU, finanziato dal CER, è dedicato al progresso della ricerca sull’elaborazione del linguaggio e all’esplorazione di nuove frontiere nella comprensione del linguaggio della vita. Il progetto sarà all’avanguardia con metodi innovativi per identificare le unità linguistiche all’interno del linguaggio della vita ed esplorare le caratteristiche e la variabilità tra le diverse specie. Inoltre, esso intende creare nuove tecniche per identificare e analizzare le funzioni di queste unità linguistiche. LifeLU si sforza di decodificare il linguaggio della vita, con l’obiettivo finale di sviluppare approcci innovativi per la prevenzione, la diagnosi e il trattamento delle malattie.

Obiettivo

"Proteins play a key role in biological processes that govern and maintain life. Although they are three-dimensional entities, they can be represented in textual form as sequences of amino acids that largely determine their structures and functions. By analogy with natural (human) languages, we can consider proteins as written with a language, which we refer to in this proposal as the ""language of life"". Natural languages can be read and understood by humans. However, we cannot yet understand the language of life. We do not even know what the vocabulary is, i.e. what the basic language units are (analogous to words in human languages). Textual representation of proteins has enabled the application of natural language processing (NLP) techniques to the study of proteins, and breakthrough results have been achieved in various downstream tasks such as protein structure prediction. However, these efforts remain only at the ""processing level"" of the language of life. The main goal of this project is to go beyond the level of language processing and open new research horizons for understanding the language of life. Using my expertise in NLP and bioinformatics, I will pursue the following objectives: (i) develop innovative methods to determine the language units (i.e. the vocabulary) of the language of life; (ii) identify the characteristics of this language as well as its variability among species; (iii) develop novel methods to identify and characterize the functions of the language units. This research will lay the foundation for a new field of research, molecular language understanding, which aims to develop methods for understanding the messages encoded in molecular sequences. The ultimate goal of this project is to decipher the language of life, which will lead to groundbreaking consequences for understanding life and health, and will shed light to the development of novel prevention, diagnosis, and treatment strategies for diseases."

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.

È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione

Meccanismo di finanziamento

HORIZON-ERC - HORIZON ERC Grants

Istituzione ospitante

BOGAZICI UNIVERSITESI
Contributo netto dell'UE
€ 1 982 800,00
Indirizzo
BEBEK
34342 Istanbul
Turchia

Mostra sulla mappa

Regione
İstanbul İstanbul İstanbul
Tipo di attività
Higher or Secondary Education Establishments
Collegamenti
Costo totale
€ 1 982 800,00

Beneficiari (1)