Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Hybrid and Interpretable Deep neural audio machines

Descripción del proyecto

Inteligencia artificial para comprender mejor el sonido

La inteligencia artificial depende considerablemente de las redes neuronales. Sin embargo, dichas redes presentan dos grandes limitaciones. En primer lugar, son muy complejas y requieren la formación de enormes cantidades de datos, además de una potencia computacional considerable, para ser eficientes. En segundo lugar, siguen siendo difíciles de interpretar. Para abordar estas carencias, el proyecto financiado por el Consejo Europeo de Investigación HI-Audio se propone desarrollar métodos híbridos que aúnen el procesamiento de señales con el aprendizaje automático para comprender y analizar el sonido. Empleará modelos de entorno acústico y sonido estadísticos y determinísticos innovadores, con redes generativas y autocodificadores neuronales específicos. El proyecto también se centrará en determinadas aplicaciones, como el análisis de escenas sonoras y musicales.

Objetivo

Machine Listening, or AI for Sound, is defined as the general field of Artificial Intelligence applied to audio analysis, understanding and synthesis by a machine. The access to ever increasing super-computing facilities, combined with the availability of huge data repositories (although largely unannotated), has led to the emergence of a significant trend with pure data-driven machine learning approaches. The field has rapidly moved towards end-to-end neural approaches which aim to directly solve the machine learning problem for raw acoustic signals but often only loosely taking into account the nature and structure of the processed data. The main consequences are that the models are 1) overly complex, require massive amounts of data to be trained and extreme computing power to be efficient (in terms of task performance), and 2) remain largely unexplainable and non-interpretable. To overcome these major shortcomings, we believe that our prior knowledge about the nature of the processed data, their generation process and their perception by humans should be explicitly exploited in neural-based machine learning frameworks.
The aim of HI-Audio is to build such hybrid deep approaches combining parameter-efficient and interpretable signal models, musicological and physics-based models, with highly tailored, deep neural architectures. The research directions pursued in HI-Audio will exploit novel deterministic and statistical audio and sound environment models with dedicated neural auto-encoders and generative networks and target specific applications including speech and audio scene analysis, music information retrieval and sound transformation and synthesis.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Palabras clave

Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-ERC - HORIZON ERC Grants

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) ERC-2021-ADG

Ver todos los proyectos financiados en el marco de esta convocatoria

Institución de acogida

INSTITUT MINES-TELECOM
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 2 482 317,50
Dirección
19 PLACE MARGUERITE PEREY
91120 Palaiseau
Francia

Ver en el mapa

Región
Ile-de-France Ile-de-France Essonne
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

€ 2 482 317,50

Beneficiarios (1)

Mi folleto 0 0