Skip to main content

Machine learning prediction for breast cancer therapy

Article Category

Article available in the folowing languages:

Algoritmi di apprendimento automatico abbinano i tumori ai trattamenti

Combinando dati dall’Unione europea e dagli Stati Uniti, il progetto PredAlgoBC ha identificato nuovi biomarcatori per i tumori al seno che potrebbero finalmente essere utilizzati per individuare opzioni di trattamento nuove e personalizzate.

Economia digitale
Salute

I ricercatori contro il cancro e gli oncologi sostengono sempre più spesso la sostituzione dei trattamenti standard con quelli paziente-specifici che tengono conto dell’eterogeneità della malattia. Nel caso del cancro al seno, il fatto che i medici non abbiano abbastanza informazioni sulle caratteristiche paziente-specifiche del tumore talvolta porta a recidive sotto forma di cancro metastatico. Mentre i trattamenti di prima linea per il cancro al seno curano circa il 90 % dei pazienti con successo, questo tasso di sopravvivenza cala fino al 27 % per il cancro metastatico. Per risolvere questo problema, gli esperti hanno costruito enormi banche dati che abbinano le caratteristiche tumorali specifiche (potenziali biomarcatori) a specifiche risposte di trattamento nei pazienti. Ma questo è solo l’inizio, e soltanto alcune firme di biomarcatori hanno raggiunto la fase clinica. «Questo è quello che definiamo maledizione della dimensionalità», afferma Agnes Basseville, ricercatrice dell’Institut de Cancérologie de l’Ouest (ICO) in Francia e coordinatrice del progetto PredAlgoBC (Machine learning prediction for breast cancer therapy). Questa ricerca è stata condotta con il sostegno del programma di Azioni Marie Skłodowska-Curie. «Attualmente abbiamo troppe caratteristiche misurate ma non abbastanza pazienti, e gli algoritmi di apprendimento automatico che utilizziamo per analizzare i dati dei biomarcatori non rendono bene in un simile contesto.» Il progetto PredAlgoBC mira a colmare questa lacuna combinando vari approcci matematici con analisi biologiche accurate. Con questo lavoro, Basseville spera di assicurarsi che le informazioni fornite dall’algoritmo siano utilizzabili nella fase clinica. «Abbiamo sviluppato il progetto principalmente intorno a due banche dati pubbliche: GEO (statunitense) ed ENA (europea). Siamo stati in grado di raccogliere dati da oltre 4 000 pazienti con cancro al seno con relative informazioni di follow-up. Combinando i set di dati, otteniamo la potenza statistica sufficiente a fornire una visione completa della complessità del tumore, anche se parte dei dati che volevamo raccogliere, ossia l’RNA-Seq, è disponibile soltanto su richiesta e dopo una valutazione semestrale di tale richiesta. A causa di limitazioni di tempo, abbiamo deciso di non utilizzarla.»

Una svolta della terapia ormonale

Il set di dati raccolto è stato diviso in due parti. Il primo è stato usato per insegnare all’algoritmo come prevedere meglio i risultati del trattamento, dopodiché il secondo è stato usato per verificare la performance di previsione del modello del progetto. «In questo modo, possiamo paragonare le previsioni del modello con la risposta nota e determinare se i nostri modelli rendono bene o no», spiega Basseville. Per ciascun modello, le variabili sono state classificate sulla base della loro importanza nella previsione generale. Le variabili con la migliore classificazione sono quelle che possono essere testate come potenziali biomarcatori. Anche se le previsioni non sono ancora abbastanza buone da essere utilizzate nella fase clinica, la classificazione delle variabili ha permesso al team di individuare gli attori dello sviluppo neurale come componenti chiave del tumore legati a scarse risposte alla terapia ormonale. Si tratta di una grande svolta, dal momento che un simile legame non era mai stato individuato formalmente prima. Un altro risultato del progetto è l’implementazione di un algoritmo di apprendimento profondo per creare coorti virtuali di pazienti. Queste si rivelano particolarmente utili, perché consentono la condivisione di dati al livello di paziente senza divulgare informazioni su soggetti reali. In conclusione, i biomarcatori di recente scoperta del progetto saranno presto presentati in un articolo sottoposto a revisione paritaria. Basseville e il suo team vi faranno seguito con i nuovi set di dati in corso di raccolta che li aiuteranno a convalidare ulteriormente questi biomarcatori. «Il prossimo passo consisterà nella definizione del miglior modo per valutare questi componenti nella fase clinica, utilizzando strumenti dell’ICO per svolgere regolarmente il test con saggi come la PCR o l’immunoistochimica. Una volta scelto il miglior saggio clinico, dovremo svolgere un’analisi retrospettiva sui pazienti presso l’ICO per convalidare i nostri nuovi marcatori e confermarne l’utilità quando si decide chi dovrebbe ricevere la terapia ormonale», osserva Basseville. Si prevede che questo processo, che sarà accompagnato dalla ricerca sul miglior modo per sfruttare i nuovi biomarcatori come nuovo target per il trattamento, impieghi diversi anni.

Parole chiave

PredAlgoBC, cancro al seno, algoritmo, biomarcatori, recidiva, previsioni, trattamento

Scopri altri articoli nello stesso settore di applicazione