Skip to main content
European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

New algorithms for inference and optimization from large-scale biological data

Article Category

Article available in the following languages:

Progressi rivoluzionari nella progettazione e nell’ingegneria delle proteine

L’implementazione di modelli statistici e algoritmi di apprendimento automatico può aiutare la progettazione e l’ingegneria di nuove proteine con funzionalità migliorate.

Economia digitale icon Economia digitale
Salute icon Salute

La progettazione di nuove proteine con funzioni desiderate è complessa ma ha enormi ripercussioni nei settori farmaceutico, biomedico e industriale. Sebbene le applicazioni mediche costituiscano oggigiorno il mercato più ricco di prodotti proteici ingegnerizzati, enzimi sintetici vengono utilizzati anche nel settore alimentare per i processi di trasformazione alimentare. Inoltre, enzimi artificiali trovano anche applicazioni ambientali nella detossificazione di inquinanti o nella progettazione di microrganismi modificati per eliminare inquinanti ambientali quali la plastica.

Semplificare la progettazione di nuove proteine

La progettazione di nuove proteine con funzionalità target migliorata è un compito difficile a causa dell’ampio spazio di sequenza e dei numerosi vincoli strutturali che devono essere soddisfatti. Una piccola proteina di 100 aminoacidi, ad esempio, conta circa 10^130 possibili varianti, più degli atomi nell’Universo, ma la stragrande maggioranza non è funzionale. Sta diventando sempre più chiaro che per trovare la migliore variante di sequenza per un dato scopo, è necessario impiegare soluzioni sperimentali sofisticate combinate con approcci computazionali avanzati. A tale scopo, il progetto INFERNET ha sviluppato strumenti efficaci per l’inferenza e l’ottimizzazione di dati su larga scala. La ricerca è stata intrapresa con il sostegno del programma di azioni Marie Skłodowska-Curie (MSCA). «Per trarre conclusioni o fare previsioni basate su modelli e tendenze osservati, abbiamo costruito modelli statistici e algoritmi di apprendimento automatico che ci hanno aiutato ad analizzare i dati e a identificare relazioni e correlazioni tra variabili», spiega Andrea Pagnani, borsista MSCA.

Modellizzare relazioni genotipo-fenotipo

Lo sviluppo di accurati saggi biochimici ad alto rendimento con tecniche di sequenziamento ha dimostrato che lo screening genetico su larga scala può essere uno strumento fondamentale per studiare la relazione tra evoluzione, fitness e altri concetti biologici alla base della ricerca sperimentale. Ciò consente l’indagine della relazione tra genotipo e fenotipo sotto una pressione selettiva controllata da fattori esterni. Tali metodi vengono abitualmente utilizzati per selezionare molecole con proprietà specifiche. INFERNET ha sviluppato un approccio probabilistico basato sui dati per modellizzare l’associazione genotipo-fenotipo derivata dagli esperimenti. Tale metodo può essere utilizzato come modello generativo per trovare nuove variazioni genetiche con elevata fitness e può essere incorporato all’interno di un processo di evoluzione diretta basato sull’apprendimento automatico.

Prevedere mutazioni durante l’evoluzione

Una caratteristica chiave correlata alla previsione della distribuzione e della frequenza delle mutazioni genetiche è la capacità di generare in modo efficiente sequenze artificiali con una data specificità target. A tale scopo sono state ideate diverse strategie computazionali e specifici approcci di modellizzazione. «Generare sequenze artificiali, dal nostro punto di vista, significa essere in grado di generare in modo efficiente un insieme di sequenze con caratterizzazioni statistiche indistinguibili dal training set», sottolinea Pagnani. INFERNET ha proposto una nuova strategia computazionale per generare sequenze che sono molto diverse da quelle naturali. Questo canale di calcolo deve essere seguito dalla convalida sperimentale dell’attività biologica dell’insieme di sequenze artificiali selezionato.

La metodologia INFERNET per migliorare la funzionalità delle proteine

Una convalida chiave della metodologia INFERNET è stata la progettazione della corismato mutasi artificiale, un enzima fondamentale nella biosintesi degli aminoacidi aromatici. I ricercatori sono stati in grado di progettare nuove varianti naturali di funzionalità conservata o migliorata. I modelli statistici INFERNET basati sulla sequenza sono stati sufficienti per specificare le proteine e fornire l’accesso a un enorme spazio di sequenze funzionali. Questo risultato ha fornito una base per un processo generale per la progettazione basata sull’evoluzione di proteine artificiali. «Tali approcci statistici basati sull’evoluzione potrebbero fornire una guida informata per la ricerca di proteine funzionali con una funzionalità target migliorata», conclude Pagnani.

Parole chiave

INFERNET, proteine, evoluzione, modelli statistici, algoritmi di apprendimento automatico, ingegneria, progettazione di proteine, mutazioni genetiche, inferenza, corismato mutasi

Scopri altri articoli nello stesso settore di applicazione