Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch de
CORDIS - Forschungsergebnisse der EU
CORDIS

Establishing a Spatio-Temporal Language for Scene Representation

Projektbeschreibung

KI beibringen, unsere Welt menschlich zu sehen und zu verstehen

Bei der künstlichen Intelligenz (KI) sind in Bezug auf Sprache und Sehen große Fortschritte zu verzeichnen. Allerdings können die Systeme von heute die Welt noch nicht wirklich genau erfassen. Sie können zwar Wörter und Bilder miteinander in Beziehung setzen, sind aber nicht in der Lage, Raum, Zeit und Bedeutung im Zusammenhang genau zu interpretieren. Diese Vereinheitlichung zu erreichen, ist jedoch von entscheidender Bedeutung für Fortschritte in den Bereichen Robotik, autonomes Fahren und intelligente Assistenz. In diesem Zusammenhang besteht das Ziel des ERC-finanzierten Projekts 4DLang darin, eine symbolische, geometrische Abstraktion physikalischer Szenen zu konstruieren und in eine raum-zeitliche Sprache zu überführen. Damit wird KI räumliche und semantische Informationen gemeinsam verarbeiten können, was ein noch tieferes Schlussfolgern und ein menschenähnliches Verständnis in realen Bereichen ermöglicht.

Ziel

We have recently experienced a boost in AI as the performance of ChatGPT-like large language models has matured from a purely scientific endeavor to deployment in various businesses and real-world applications. Also in computer vision, we have seen tremendous gains that were enabled by scaling to large models trained on vast corpuses of data in an unsupervised fashion.

Language is symbolic and can inform about abstract properties and relationships, while vision without human labels does not model explicit semantics and brings distributed representations for spatial structures. Both are complementary, and the fundamental unsolved challenge is to bring them together. The current state of the art is to follow the common paradigm of scale and to naively train models on large amounts of data to exploit the co-occurence of objects in single images and words in text captions to learn their correlation. However, looking at the outputs of these models reveals that they in fact perform extremely poorly in many cases.

The next step to approach human-level AI requires reasoning about scenes spatially and semantically at the same time and demands an abstraction of our real world that brings both of these modalities together, while being lightweight and highly efficient. 4DLang presents the solution and introduces a new approach by first creating a primitive-based geometric symbolic abstraction of physical scenes that is then shaped into a spatio-temporal language. It will enable the fine-grained coupling of both modalities and go beyond the state of the art by augmenting large language models with real-world understanding that is only present in observations of moving scenes, as we humans perceive them. This design will fundamentally advance the generalization abilities of AI and have a large impact on downstream applications, such as content interpretation and generation, AI assistants, robotics, and autonomous driving.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

HORIZON-ERC - HORIZON ERC Grants

Alle im Rahmen dieses Finanzierungsinstruments finanzierten Projekte anzeigen

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

(öffnet in neuem Fenster) ERC-2025-STG

Alle im Rahmen dieser Aufforderung zur Einreichung von Vorschlägen finanzierten Projekte anzeigen

Gastgebende Einrichtung

TECHNISCHE UNIVERSITAT NURNBERG
Netto-EU-Beitrag

Finanzieller Nettobeitrag der EU. Der Geldbetrag, den der Beteiligte erhält, abzüglich des EU-Beitrags an mit ihm verbundene Dritte. Berücksichtigt die Aufteilung des EU-Finanzbeitrags zwischen den direkten Begünstigten des Projekts und anderen Arten von Beteiligten, wie z. B. Dritten.

€ 1 563 730,00
Adresse
Dr.-Luise-Herzberg-Straße 4
90461 NUREMBERG
Deutschland

Auf der Karte ansehen

Region
Bayern Mittelfranken Nürnberg, Kreisfreie Stadt
Aktivitätstyp
Higher or Secondary Education Establishments
Links
Gesamtkosten

Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.

€ 1 563 730,00

Begünstigte (1)

Mein Booklet 0 0