Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS

Understanding Deep Learning

Projektbeschreibung

Entdecken, wie Deep Learning tatsächlich funktioniert

Deep Learning (DL) simuliert ein neuronales Netz, das mithilfe mehrerer Schichten selbstständig aus Daten lernt. Obwohl es sich in vielen Anwendungen bewährt hat, ist seine theoretische Grundlage nach wie vor unbekannt. Das vom Europäischen Forschungsrat finanzierte Projekt UnderstandingDL verfolgt einen dreigleisigen Ansatz. Erstens sollen neue Modelle entwickelt werden, die mit dem stochastischen Gradientenabstieg, einem Optimierungsalgorithmus für das Training neuronaler Netze, erlernt werden können. Dadurch können neue DL-Algorithmen entstehen, die theoretisch verstanden werden. Zweitens wird das Projekt die Komplexität der Stichproben verschiedener neuronaler Netzwerktypen und Verbindungsstärken der Knoten untersuchen. Dies soll erklären, wie DL mit weniger Beispielen als Parametern auskommen und dennoch erfolgreich generalisieren kann. Schließlich wird das Projekt die Funktionalität neuronaler Netze untersuchen, einschließlich der Vorteile der Tiefe und der Auswirkungen absichtlich verfälschter Daten (so genannter negativer Beispiele).

Ziel

While extremely successful, deep learning (DL) still lacks a solid theoretical foundation.

In the last 5 years the PI focused almost entirely on DL theory, yielding a strong publication record with 7 papers at NeurIPS (the leading ML conference), including 2 spotlights (top 3% of submitted papers) and one oral (top 1%), 2 papers at ICLR (the leading DL conference), and 1 paper at COLT (the leading ML theory conference). These results are amongst the first that break a 20 years hiatus in NN theory, thereby giving some hope for a solid deep learning theory. This includes 1) the first poly-time learnability result for non-trivial function class by SGD on NN, 2) the first such result with near optimal rate, 3) new methodology to bound the sample complexity of NN, that established the first sample complexity bound that is sublinear in the number of parameters, under norm constraints that are valid in practice, 4) an explanation to the phenomena of adversarial examples.

We plan to go far beyond these and other results, and to build a coherent theory for DL, addressing all three pillars of learning theory:
Optimization: We plan to investigate the success of SGD in finding a good model, arguably the greatest mystery of modern deep learning. Specifically our goal is to understand what models are learnable by SGD on neural networks. To this end, we plan to come up with a new class of models that can potentially lead to new deep learning algorithms, with a solid theory behind them.
Statistical Complexity: We plan to crack the second great mystery of modern deep learning, which is their ability to generalize with fewer examples than parameters. Our plan is to investigate the sample complexity of classes of neural networks that are defined by bounds on the weights’ magnitude.
Representation: We plan to investigate functions that can be realized by NN. This includes classical questions such as the benefits of depth, as well as more modern aspects such as adversarial examples.

Programm/Programme

Finanzierungsplan

HORIZON-ERC -

Gastgebende Einrichtung

THE HEBREW UNIVERSITY OF JERUSALEM
Netto-EU-Beitrag
€ 1 499 750,00
Adresse
EDMOND J SAFRA CAMPUS GIVAT RAM
91904 Jerusalem
Israel

Auf der Karte ansehen

Aktivitätstyp
Mittlere und höhere Bildungseinrichtungen
Links
Gesamtkosten
€ 1 499 750,00

Begünstigte (1)