Tecnología de reconocimiento del habla para controladores de tráfico aéreo
Uno de los mayores obstáculos a la introducción de mayores niveles de automatización en la gestión del tráfico aéreo (GTA) es el uso generalizado de comunicaciones por radio para enviar a los pilotos instrucciones sobre el control del tráfico aéreo (CTA). El reconocimiento automático del habla, que convierte el habla humana en texto, ofrece una forma de reducir considerablemente la carga de trabajo de los COTA y aumentar le eficacia de la GTA. El proyecto financiado mediante Horizonte 2020 MALORCA se propuso reducir los costes de desarrollo y mantenimiento de los sistemas de reconocimiento de voz basada en asistentes (ABSR, por sus siglas en inglés) mediante aprendizaje automático en lugar de mediante programación de «software». Esta iniciativa se financió en el marco de la empresa común SESAR, una colaboración público-privada creada para modernizar el sistema de GTA europeo. Adaptación a las condiciones locales Los sistemas de CTA modernos deben ser seguros y eficaces además de estar actualizados. Estos precisan, por tanto, que los COTA aporten una considerable cantidad de información, la cual actualmente se recoge mediante teclados y ratones. Las tecnologías modernas como los enlaces de datos aire-tierra, que en ciertos casos son capaces de sustituir las comunicaciones por voz, requerirán más información de los COTA. Esta enorme carga de trabajo puede reducirse mediante el ABSR. «Por suerte, el reconocimiento de voz automático ha alcanzado un grado de fiabilidad suficiente como para implementarlo en un sistema de GTA», indica Hartmut Helmke, coordinador del proyecto. «No obstante, es necesario reducir los costes que supone transferir los sistemas de reconocimiento del habla de un ámbito a otro». Hoy en día, varios módulos de reconocimiento del habla precisan de una adaptación manual a las necesidades locales debido a variables acústicas y de idioma como los acentos regionales, las desviaciones en la fraseología y las limitaciones locales. MALORCA propuso una solución eficaz, barata y general para automatizar este proceso de reaprendizaje, adaptación y personalización. En ella se emplean técnicas de reconocimiento del habla local y modelos de COTA extraídos de registros de radar y grabaciones de voz. MALORCA desarrolló nuevas herramientas de aprendizaje automático para aprender de forma automática el comportamiento de los COTA y adaptar los modelos de reconocimiento del habla mediante datos registrados previamente por los proveedores de servicios de navegación aérea. El aprendizaje automático se sirve de técnicas estadísticas que permiten a los sistemas informáticos «aprender» y mejorar su rendimiento en tareas específicas con el paso del tiempo a partir de unos datos previos sin necesidad de programarlos de manera explícita. De este modo, se sustituye gran parte del trabajo manual necesario hasta ahora y se reducen los costes, dado que el aprendizaje automático de los modelos de ABSR abarata y acelera la adaptación a distintos aeropuertos y su mantenimiento. Primer paso Los socios del proyecto se valieron de la información de un «gestor de llegadas» de los aeropuertos de Praga y Viena para dividir automáticamente los datos de formación no transcritos en un grupo positivo y otro negativo a partir de parámetros de confianza específicos. Estas mediciones se utilizaron posteriormente en los algoritmos de aprendizaje automático desarrollados para reforzar el aprendizaje mediante datos de adaptación. En el contexto de ABSR, el «gestor de llegadas» permite predecir las órdenes de CTA relevantes para la situación del momento. Las órdenes predichas se comparan con el resultado del «software» de reconocimiento del habla. Si una orden no se predice, se presupone que el sistema de reconocimiento ha generado una orden errónea. El proyecto ofrece así a la industria de la aviación un método práctico para desarrollar e instalar un sistema vanguardista de reconocimiento del habla e integrarlo en los sistemas de comunicación por voz de los proveedores de servicios de navegación aérea. El uso de aprendizaje automático aplicado al reconocimiento del habla es solo un caso práctico de las múltiples aplicaciones que posee para el CTA. Estas posibles aplicaciones también podrían reducir los costes de adaptación y mantenimiento de otras herramientas de CTA. Por ejemplo, la adaptación de un «gestor de llegadas» genérico a aeropuertos concretos podría ser la siguiente.
Palabras clave
MALORCA, reconocimiento del habla, tráfico aéreo, aprendizaje automático, reconocimiento de voz basada en asistentes (ABSR)