Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Disrupting the Communication between Humans and Computers - Understanding the Key Message in Simultaneous Conversations Through Voice Biometrics

Article Category

Article available in the following languages:

Un nuevo «software» de asistente virtual está a punto de transformar las reuniones de trabajo

Un proyecto financiado con fondos europeos ha desarrollado un programa informático de asistente virtual que puede fomentar una participación constructiva y reducir las distracciones durante las reuniones de empresa. El programa se ocupa de tareas rutinarias, como transcribir las conversaciones, tomar notas o incluso añadir las tareas en el calendario de gestión de proyectos.

Economía digital icon Economía digital
Sociedad icon Sociedad

El uso de asistentes virtuales en el trabajo cada vez es más frecuente. La empresa de estudios de mercado Gartner prevé que, para 2021, el 25 % de los trabajadores utilizarán un asistente virtual a diario. La tecnología puede ayudar a empresas de todos los tamaños —desde empresas de nueva creación a pequeñas y medianas empresas o también grandes empresas— encargándose de los procesos repetitivos y laboriosos asociados con las reuniones.

El siguiente paso en la comunicación entre máquinas y personas

Los asistentes virtuales inteligentes se basan en el procesamiento de lenguaje natural, una forma de inteligencia artificial que tiene por objetivo permitir a los ordenadores comprender el idioma humano. «Nuestra misión es revolucionar la interacción entre personas y máquinas, haciendo que la comunicación sea más natural y fluida», destaca Marta Casar, ingeniera en Verbio y coordinadora del proyecto financiado con fondos europeos PAY-ME-ATTENTION. «El programa de asistente virtual de Verbio es uno de los sistemas más avanzados del mercado; permite un procesamiento de voz continuo y transcripciones en tiempo real prácticamente sin errores». Al contrario que otros sistemas, que a menudo fallan en entornos reales, el de Verbio puede interpretar al instante el flujo natural de conversación y distinguir los datos de los usuarios de la música y el ruido de fondo. «Basándonos en los últimos avances en inteligencia artificial, creamos innovadores algoritmos que pueden contribuir a una magnífica función de reconocimiento de voz. Realmente creemos que nuestros algoritmos se emplearán en todos los asistentes virtuales y sistemas de reconocimiento de voz del mundo, mejorando su precisión y reduciendo su vulnerabilidad a las amenazas de seguridad», afirma Casar.

Módulos de «software» de vanguardia

El programa informático de asistente virtual de Verbio consta de varios módulos que pueden trabajar en conjunto o integrarse por separado en el «software» de reconocimiento de voz. La entrada de voz se registra mediante una configuración circular de seis micrófonos que envía la secuencia de audio a un servidor de almacenamiento. Un módulo de mejora del habla aumenta la calidad del habla mediante diversas técnicas: dirección de llegada, conformación del haz, cancelación de eco y eliminación de ruido, y control automático de ganancia. El sistema también utiliza dos módulos adicionales para mejorar el procesamiento de voz: uno que detecta la presencia o ausencia de habla humana, y un módulo de separación ciega de fuentes que separa un conjunto de señales de fuente del conjunto de señales mixtas procedentes de los seis micrófonos. Mientras tanto, un sistema de diarización de los altavoces divide las secuencias de audio obtenidas en segmentos y las agrupa en función de la identidad del orador. Los resultados de este módulo se procesan mediante un sistema biométrico de voz que verifica las identidades de los oradores asociando cada segmento diarizado con el orador correspondiente. La transcripción de la conversación se lleva a cabo mediante un sistema de reconocimiento de voz continuo. El programa informático de Verbio también utiliza una técnica de procesamiento de lenguaje natural que extrae automáticamente el significado de los textos transcritos identificando temas recurrentes. «Nuestra técnica de clasificación de temas nos ofrece una visión general instantánea de todos los temas abordados en la reunión. Además, hemos diseñado una técnica para clasificar el tema en función de su prioridad: cuantas más palabras se pronuncien sobre un asunto, mayor es su prioridad», explica Casar. Por último, el módulo de resumen cifra y agrupa frases con un significado similar para mostrar un texto más breve. Los asistentes virtuales en las salas de reuniones van a ser el próximo gran avance en el trabajo. «Nuestro sistema integrado puede funcionar en cualquier tipo de sala de reuniones. Pronto los asistentes virtuales también podrán mejorar la productividad en videoconferencias virtuales, e incluso lograrán organizarlas», concluye Casar.

Palabras clave

PAY-ME-ATTENTION, asistente virtual, Verbio, procesamiento de lenguaje natural, reunión de trabajo, inteligencia artificial, transcripción de conversaciones, diarización de oradores

Descubra otros artículos del mismo campo de aplicación