CORDIS - Resultados de investigaciones de la UE
CORDIS

Heterogeneous Learning for Natural Language Processing

Article Category

Article available in the following languages:

Una interfaz realista basada en el habla

Un equipo de investigadores apoyado por la Unión Europea ha contribuido a mejorar el reconocimiento del habla humana por parte de los ordenadores. El trabajo realizado consistió en introducir en ordenadores grandes volúmenes de materiales fuente, en un formato previamente estructurado, y en combinar esto con algoritmos de nueva creación que realizan una estructuración automática.

Economía digital icon Economía digital

Los ordenadores siguen presentando grandes limitaciones en lo que concierne a la interpretación de la comunicación humana natural. Un motivo es que el principal método seguido para «instruir» a los ordenadores, la anotación a cargo de expertos, es lento y caro y carece de flexibilidad. El proyecto financiado con fondos europeos HELENLP (Heterogeneous learning for natural language processing) tenía el cometido de desarrollar sistemas con mayor capacidad de interacción con humanos. Sus artífices se aplicaron a mejorar las prestaciones añadiendo una gama muy amplia de fuentes digitales nuevas y empleando diversos grados de anotación. Usando los algoritmos previstos, los ordenadores serían capaces de interpretar de forma automática las fuentes consultando un anotador. El equipo desarrolló algoritmos de anotación adicionales con el objetivo último de mejorar la comprensión de texto y del habla natural por parte de las máquinas. Los trabajos giraron en torno a nuevos métodos informáticos y estadísticos para integrar y analizar fuentes digitales. Se idearon métodos pasivos de anotación de datos ya anotados parcialmente, sin usar un anotador, y también métodos activos con uso de un anotador. Los nuevos algoritmos abordan además el aprendizaje simultáneo mediante una combinación de varias fuentes de datos anotados. Entre las aplicaciones cabe mencionar la categorización de textos, la segmentación de fonemas y su reconocimiento. Los artífices de la iniciativa cumplieron su objetivo de integrar un grupo de investigación sólido. De esta labor ha surgido un equipo de investigadores, fondos adicionales y publicaciones científicas. Los algoritmos creados en HELENLP podrían mejorar el procesamiento informático de la comunicación humana natural.

Palabras clave

Ordenador, habla humana, comunicación humana, anotación, procesamiento de lenguaje natural

Descubra otros artículos del mismo campo de aplicación