Projektbeschreibung
Wie maschinelles Lernen dem menschlichen Denken ähnlicher wird
Die Algorithmen des maschinellen Lernens können dank neuronaler Netze die zugrundeliegenden Zusammenhänge in Datensätzen erkennen und verschiedene Aufgaben erfüllen, wie Klassifizierung von Bildern oder Sprachverarbeitung. Doch noch immer ist die künstliche Intelligenz (KI) weit vom Menschen entfernt, der zu einer immensen Bandbreite von Tätigkeiten in der Lage ist, sei es textliche oder visuelle Informationen schnell in einzelnen Einheiten zu strukturieren oder komplexe Zusammenhänge zu verstehen. Darum will das EU-finanzierte Projekt HOLI eine neue allgemeingültige Methodologie für die semantische Verarbeitung von eingehenden Informationen erstellen, mit der Deep-Learning-Algorithmen zur holistischen Inferenz befähigt werden. Genutzt wird dazu ein ganzheitlicher Ansatz auf der Grundlage von Deep-Learning-Architekturen sowie entsprechend entwickelter Theorie und Algorithmen. Mit den dadurch ermöglichten Anwendungen im maschinellen Lesen oder für Text-zu-Bild-Analysen wird das Projekt die KI-Technologien enorm voranbringen.
Ziel
Machine learning has rapidly evolved in the last decade, significantly improving accuracy on tasks such as image classification. Much of this success can be attributed to the re-emergence of neural nets. However, learning algorithms are still far from achieving the capabilities of human cognition. In particular, humans can rapidly organize an input stream (e.g. textual or visual) into a set of entities, and understand the complex relations between those. In this project I aim to create a general methodology for semantic interpretation of input streams. Such problems fall under the structured-prediction framework, to which I have made numerous contributions. The proposal identifies and addresses three key components required for a comprehensive and empirically effective approach to the problem.
First, we consider the holistic nature of semantic interpretations, where a top-down process chooses a coherent interpretation among the vast number of options. We argue that deep-learning architectures are ideally suited for modeling such coherence scores, and propose to develop the corresponding theory and algorithms. Second, we address the complexity of the semantic representation, where a stream is mapped into a variable number of entities, each having multiple attributes and relations to other entities. We characterize the properties a model should satisfy in order to produce such interpretations, and propose novel models that achieve this. Third, we develop a theory for understanding when such models can be learned efficiently, and how well they can generalize. To achieve this, we address key questions of non-convex optimization, inductive bias and generalization. We expect these contributions to have a dramatic impact on AI systems, from machine reading of text to image analysis. More broadly, they will help bridge the gap between machine learning as an engineering field, and the study of human cognition.
Wissenschaftliches Gebiet (EuroSciVoc)
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht.
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht.
- NaturwissenschaftenInformatik und Informationswissenschaftenkünstliche Intelligenzmaschinelles LernenDeep Learning
Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen
Schlüsselbegriffe
Programm/Programme
Thema/Themen
Finanzierungsplan
ERC-COG - Consolidator GrantGastgebende Einrichtung
69978 Tel Aviv
Israel