L’apprendimento in ambienti dinamici

Un progetto finanziato dall’UE ha istituito un nuovo paradigma per l’apprendimento in ambienti dinamici su larga scala associati a elementi di incertezza.

Tecnologie industriali

L’obiettivo generale del progetto PLURELEARN (“Plural reinforcement learning”) era di sviluppare algoritmi, teorie e applicazioni che utilizzano numerosi approcci e modelli di apprendimento in maniera singergica. Per raggiungere il suo scopo, il progetto ha identificato tre obiettivi: sviluppare un approccio didattico che combina l’apprendimento da un insegnante con l’apprendimento tramite sperimentazione ed errori, prevedere una metodologia di scoperta della struttura per il ragionamento sull’incertezza in processi Markov di grandi dimensioni e sviluppare approcci per la selezione di algoritmi e mini-strategie. Il team ha compiuto progressi nel raggiungimento di tali obiettivi. La ricerca relativa al primo obiettivo ha prodotto relazioni su come utilizzare i consigli di tutor o esperti nei paradigmi dell’apprendimento per rinforzo. Il lavoro ha mostrato nuovi algoritmi per il problema dell’apprendimento da fonti multiple, nonché come gli algoritmi funzionano in applicazioni di medie dimensioni. Il problema della scoperta della struttura (obiettivo 2) si è rivelato alquanto complesso. Dopo aver sviluppato gli aspetti teorici e applicati della selezione del modello e della scoperta della struttura, evidenziando la difficoltà di rilevare la struttura dinamica, il team ha sviluppato due approcci per ridurre il rischio. Il primo è basato su gradienti politici e impostato su problemi per i quali è disponibile un simulatore. Il secondo è basato su un approccio di ottimizzazione, in cui l’attenzione è concentrata su alcune incertezze tra gli stati. Per il terzo obiettivo, i ricercatori hanno progettato due strategie che potrebbero migliorare le prestazioni. La prima era di modificare le opzioni e poi generare opzioni nuove e migliorate. La seconda era un modo di utilizzare le opzioni “generate casualmente” per velocizzare la programmazione e l’apprendimento. Il progetto ha avuto buon esito nel sviluppare un nuovo quadro per la programmazione e l’apprendimento in ambienti basati sui dati e mutevoli. La ricerca potrebbe aprire opportunità per l’ottimizzazione su larga scala dei sistemi dinamici che potrebbero avere un notevole impatto sulla quantità di problemi che potrebbero essere risolti.

Parole chiave

Scopri altri articoli nello stesso settore di applicazione

Ispirarsi al regno animale per aiutare i robot a rimettersi in piedi

25 Ottobre 2021

Pelle sintetica che rende sensibili i robot ai colleghi umani

22 Novembre 2021

Aiutare i robot a fare i conti con il mondo reale

17 Maggio 2021

Un approccio incentrato sulla dimensione umana contribuisce a instaurare un clima di fiducia nell’IA per la produzione

1 Agosto 2023

Informazioni relative al progetto

PLURELEARN

ID dell’accordo di sovvenzione: 249254

Progetto chiuso

Data di avvio 1 Novembre 2009

Data di completamento 31 Ottobre 2013

Finanziato da

Specific programme "People" implementing the Seventh Framework Programme of the European Community for research, technological development and demonstration activities (2007 to 2013)

Costo totale

€ 100 000,00

Contributo UE

€ 100 000,00

100 000,00

Coordinato da

TECHNION - ISRAEL INSTITUTE OF TECHNOLOGY
Israel

Parole chiave

Scopri altri articoli nello stesso settore di applicazione

Scarica Scarica il contenuto della pagina