Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS
Inhalt archiviert am 2024-06-18

Trading Quantity for Quality in Machine Learning

Ziel

Machine learning was born in an era when most datasets were small, low-dimensional, and used carefully hand-crafted features. However, recent years have seen a dramatic change in the nature of typical machine learning tasks: These are now routinely performed on huge, web-scale datasets, with data quantity no longer being a major bottleneck. On the flip side, the large-scale and automated data-gathering methods used to create such massive datasets often go hand-in-hand with mediocre quality of individual data items. This data quality problem can hamper standard learning algorithms, despite the availability of more data. A related issue is the quality of available features: with more data, we are in a position to tackle harder tasks - particularly in AI-related areas such as computer vision and natural language processing. However, it is also becoming increasing hard to hand-craft good features for such tasks, and much recent research is devoted to automatically learn higher-quality, multi-level representations of the data.

The objective of the proposed research is to study how increasing data quantity can be used to improve or compensate for poor data quality, provably and efficiently. In particular, we wish to study how to use large-scale, low-quality datasets, to achieve the same learning performance as if we had a high-quality, yet more moderately sized dataset. We plan to explore several important settings where we believe such a trade-off can be obtained, using a theoretically principled approach. These include (1) Learning deep data representations, which capture complex and high-level features; (2) Learning from incomplete data, where some or even most of the data is missing; and (3) bandit learning and optimization, which capture learning and decision making under uncertainty. Our research plan builds on concrete preliminary results and several novel ideas, which are outlined as part of the proposal.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

FP7-PEOPLE-2013-CIG
Andere Projekte für diesen Aufruf anzeigen

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

MC-CIG - Support for training and career development of researcher (CIG)

Koordinator

WEIZMANN INSTITUTE OF SCIENCE
EU-Beitrag
€ 100 000,00
Gesamtkosten

Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.

Keine Daten
Mein Booklet 0 0