Graphs without Labels: Multimodal Structure Learning without Human Supervision

Información del proyecto

GraViLa

Identificador del acuerdo de subvención: 101117556

DOI

10.3030/101117556

Fecha de la firma de la CE 19 Marzo 2024

Fecha de inicio 1 Abril 2024

Fecha de finalización 31 Marzo 2029

Financiado con arreglo a

European Research Council (ERC)

Coste total

€ 1 499 438,00

Aportación de la UE

€ 1 499 438,00

1 499 438,00

Coordinado por

EBERHARD KARLS UNIVERSITAET TUEBINGEN
Germany

Descripción del proyecto

Aprendizaje de estructuras semánticas a partir de datos multimodales sin anotación humana

El aprendizaje multimodal consiste en entrenar modelos a partir de datos de varias modalidades, como vídeos que contienen componentes visuales y sonoros o documentos que contienen texto e imágenes. Dicha técnica utiliza datos emparejados, como pares imagen-texto, para entrenar modelos de aprendizaje profundo, lo cual les permite aprender representaciones más robustas sin necesidad de supervisión humana. El equipo del proyecto GraViLa, financiado por el Consejo Europeo de Investigación, propone que los modelos multimodales pueden captar eficazmente entidades semánticas intermodales y resultan especialmente beneficiosos para analizar colecciones de modalidades y temas interconectados, algo habitual en los documentos multimodales. El equipo del proyecto lo consigue aprendiendo estructuras semánticas a partir de datos multimodales mediante aprendizaje multimodal y autosupervisado, eliminando la necesidad de anotación humana. A continuación, esta información se representa en forma de gráfico, lo cual facilita el tratamiento y la comprensión de datos a gran escala.

Objetivo

Multimodal learning focuses on training models with data in more than one modality, such as videos capturing visual and audio information or documents containing image and text. Current approaches use such data to train large-scale deep learning models without human supervision by sampling pair-wise data e.g. an image-text pair from a website and train the network e.g. to identify matching vs. not matching pairs to learn better representations.
We argue that multimodal learning can do more: by combining information from different sources, multimodal models capture cross-modal semantic entities, and as most multimodal documents are a collection of connected modalities and topics, multimodal models should allow us to capture the inherent high-level topology of such data. The goal of the following project is to learn semantic structures from multimodal data to capture long-range concepts and relations in multimodal data via multimodal and self-supervision learning without human annotation. We will represent this information in form of a graph, considering latent semantic concepts as nodes and their connectivity as edges. Based on this structure, we will extend current unimodal approaches to capture and process data from different modalities in a single structure. Finally, we will explore the challenges and opportunities of the proposed idea with respect to their impact on two main challenges in machine learning: data-efficient learning and fairness in label-free learning.
By bridging the gap between those two parallel trends, multimodal supervision and graph-based representations, we combine their strengths of generating and processing topological data, which will not only allow to build new applications and tools but also opens new ways of processing and understanding large-scale data that are out-of-reach at the moment.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Palabras clave

Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

HORIZON.1.1 - European Research Council (ERC) PROGRAMA PRINCIPAL
Ver todos los proyectos financiados en el marco de este programa

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

ERC-2023-STG - ERC STARTING GRANTS
Ver todos los proyectos financiados en el marco de este tema

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-ERC - HORIZON ERC Grants

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) ERC-2023-STG

Ver todos los proyectos financiados en el marco de esta convocatoria

Institución de acogida

EBERHARD KARLS UNIVERSITAET TUEBINGEN

Aportación neta de la UEn

€ 1 499 438,00

Dirección

GESCHWISTER-SCHOLL-PLATZ
72074 Tuebingen
Alemania

Región

Baden-Württemberg Tübingen Tübingen, Landkreis

Tipo de actividad

Higher or Secondary Education Establishments

Enlaces

Contactar con la organización Sitio web

Participación en los programas de I+D de la UE

Red de colaboración de HORIZON

Coste total

€ 1 499 438,00

Beneficiarios (2)

EBERHARD KARLS UNIVERSITAET TUEBINGEN

Alemania

Aportación neta de la UEn

€ 1 499 438,00

RHEINISCHE FRIEDRICH-WILHELMS-UNIVERSITAT BONN

Alemania

Aportación neta de la UEn

€ 0,00

Descripción del proyecto

Aprendizaje de estructuras semánticas a partir de datos multimodales sin anotación humana

Objetivo

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Palabras clave

Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

Institución de acogida

Beneficiarios (2)

Compartir esta página Compartir esta página en las redes sociales

Descargar el PDF Descargar el contenido de la página

Graphs without Labels: Multimodal Structure Learning without Human Supervision

Descripción del proyecto

Aprendizaje de estructuras semánticas a partir de datos multimodales sin anotación humana

Objetivo

Ámbito científico (EuroSciVoc) CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Palabras clave Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s) Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s) Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

Institución de acogida

Beneficiarios (2)

Compartir esta página Compartir esta página en las redes sociales

Descargar el PDF Descargar el contenido de la página

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Palabras clave

Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.