Descripción del proyecto
Acortar la brecha entre el aprendizaje automático y la cognición humana
Las redes neuronales permiten a los algoritmos de aprendizaje automático reconocer las relaciones subyacentes en un conjunto de datos y realizar diversas tareas, como la clasificación de imágenes o el procesamiento del habla. Sin embargo, la inteligencia artificial (IA) aún está lejos de la capacidad humana para realizar una gran variedad de funciones, como organizar rápidamente un flujo de entrada textual o visual en un conjunto de entidades o comprender relaciones complejas. Para acortar esta brecha, el objetivo del proyecto financiado con fondos europeos HOLI es crear una nueva metodología general para la interpretación semántica de flujos de entrada que permita a los algoritmos de aprendizaje profundo realizar una deducción holística. Se logrará mediante un método holístico, basado en arquitecturas de aprendizaje profundo, teoría y algoritmos convenientemente desarrollados. El proyecto servirá de detonante para avances enormes en las tecnologías de IA, lo que servirá para aplicaciones como la lectura automática o el análisis de texto a imagen.
Objetivo
Machine learning has rapidly evolved in the last decade, significantly improving accuracy on tasks such as image classification. Much of this success can be attributed to the re-emergence of neural nets. However, learning algorithms are still far from achieving the capabilities of human cognition. In particular, humans can rapidly organize an input stream (e.g. textual or visual) into a set of entities, and understand the complex relations between those. In this project I aim to create a general methodology for semantic interpretation of input streams. Such problems fall under the structured-prediction framework, to which I have made numerous contributions. The proposal identifies and addresses three key components required for a comprehensive and empirically effective approach to the problem.
First, we consider the holistic nature of semantic interpretations, where a top-down process chooses a coherent interpretation among the vast number of options. We argue that deep-learning architectures are ideally suited for modeling such coherence scores, and propose to develop the corresponding theory and algorithms. Second, we address the complexity of the semantic representation, where a stream is mapped into a variable number of entities, each having multiple attributes and relations to other entities. We characterize the properties a model should satisfy in order to produce such interpretations, and propose novel models that achieve this. Third, we develop a theory for understanding when such models can be learned efficiently, and how well they can generalize. To achieve this, we address key questions of non-convex optimization, inductive bias and generalization. We expect these contributions to have a dramatic impact on AI systems, from machine reading of text to image analysis. More broadly, they will help bridge the gap between machine learning as an engineering field, and the study of human cognition.
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
- ciencias naturalesinformática y ciencias de la informacióninteligencia artificialaprendizaje automáticoaprendizaje profundo
Para utilizar esta función, debe iniciar sesión o registrarse
Palabras clave
Programa(s)
Régimen de financiación
ERC-COG - Consolidator GrantInstitución de acogida
69978 Tel Aviv
Israel