Servicio de Información Comunitario sobre Investigación y Desarrollo - CORDIS

Reportaje - Un salto cualitativo en el procesamiento del lenguaje natural aplicado a la enseñanza

En muchos casos importa más el provecho que se obtiene de utilizar algo que la frecuencia de uso. Esta apreciación se cumple en numerosos aspectos de la vida, entre ellos los de la tecnología y la educación. Una investigación financiada con fondos europeos se encuentra a la vanguardia del análisis cualitativo del aprendizaje potenciado por la tecnología empleando el procesamiento del lenguaje natural (PLN).
Reportaje - Un salto cualitativo en el procesamiento del lenguaje natural aplicado a la enseñanza
El PLN es un campo a caballo entre la informática y la lingüística que ha suscitado interés en diversos sectores académicos, empresariales y gubernamentales. Posee numerosas aplicaciones posibles: programas informáticos para convertir texto en voz, traducción automática de idiomas y minería de datos en busca de conceptos específicos. Pero su funcionamiento dista mucho de ser perfecto.

Las herramientas de análisis cuantitativo se vienen utilizando hace tiempo en el campo en expansión del aprendizaje potenciado por la tecnología, en el que los ordenadores y el software desempeñan una función fundamental en el modo en que los alumnos reciben información, la estudian y se comunican con sus profesores y entre sí. Ahora bien, el análisis cuantitativo es capaz de ofrecer perspectivas ilustrativas sobre la cantidad de trabajo realizada por determinado alumno, la frecuencia con la que consulta los materiales didácticos, asiste a clase o se comunica con los demás, pero es incapaz de medir el valor de estas interacciones. En este contexto es donde cobra relevancia el análisis cualitativo.

«La mayoría de las herramientas de análisis desarrolladas hasta la fecha para la comunidad dedicada al aprendizaje potenciado por la tecnología miden cómo y cuánto los estudiantes hacen determinada cosa; pero lo que se necesita son herramientas y tecnologías centradas en el provecho que se obtiene de ellas. Esa información puede servir para orientarles y que sigan progresando», explicó Wolfgang Greller, profesor asociado de nuevas tecnologías mediáticas e innovación en conocimientos en la Universidad Abierta de los Países Bajos.

El Dr. Greller coordinó el proyecto (LTfLL) («Tecnologías lingüísticas aplicadas a la educación permanente»), en el que once entidades académicas y empresariales de siete países europeos desarrollaron soluciones innovadoras centradas en el aspecto cualitativo del aprendizaje potenciado por la tecnología.

En el marco de este proyecto, a cuya investigación la Comisión Europea dotó con 2,85 millones de euros, se desarrollaron y probaron en la práctica seis herramientas destinadas a ayudar a alumnos y docentes en distintos aspectos, desde el diálogo y el análisis textual hasta el examen del nivel inicial de los estudiantes y su desarrollo de conceptos. De paso también lograron avances tecnológicos considerables en el campo del PLN.

«Quien haya utilizado alguna vez Google Translate, el programa informático de reconocimiento de voz Dragon o herramientas similares sabrá que su precisión no es del 100%. Pero es una cuestión relativa, porque si uno espera un 100% y obtiene un 80%, el resultado le parece malo; en cambio, si uno no espera nada y el resultado muestra una precisión del 80%, entonces considera que es mucho mejor que nada», destacó el Dr. Greller.

De cara a desarrollar servicios y herramientas inteligentes y de nueva generación de apoyo y asesoramiento para un aprendizaje individual y colaborativo, los investigadores de LTfLL debían lograr progresos en dos cuestiones fundamentales que lastran el PLN: la precisión y la velocidad.

Una evaluación precisa de los alumnos

En cuanto a la primera cuestión, los investigadores desarrollaron una técnica con la que medir la precisión de los resultados obtenidos con sus herramientas en función de valores de referencia fijados por expertos humanos. Se utilizó, por ejemplo, para mejorar herramientas de LTfLL dedicadas al examen de nivel inicial (es decir, valorar el nivel de determinada asignatura en el que convendría colocar a un alumno nuevo en función de sus conocimientos de partida) y el desarrollo de conceptos (hasta qué punto determinado alumno asimila el material y progresa a medida que avanza el curso).

«En lo referente al análisis del nivel de partida, se formuló una serie de preguntas a alumnos a las que debían responder con una redacción. Seguidamente sus respuestas fueron analizadas por la herramienta tomando como referencia las llamadas "respuestas de manual" proporcionadas por expertos y docentes. Éste procedimiento depende en gran medida de la precisión de la tecnología de PLN», explicó el Dr. Greller.

El sistema no se ha diseñado para asignar automáticamente a todo alumno nuevo a una clase o nivel en concreto, sino para ofrecer a los docentes una orientación sobre su dominio actual de una materia con más eficacia -en cuanto a tiempo y coste- que si se utilizaran pruebas de tipo test o encuentros en persona, como es habitual en la actualidad.

Del mismo modo, el análisis del desarrollo de conceptos permite medir el rendimiento de los alumnos examinando los contenidos educativos que producen y examinar hasta qué punto el lenguaje que emplean para definir conceptos se corresponde con el lenguaje utilizado por los especialistas.

«No se trata simplemente de contar el número de palabras clave que un estudiante introduce en su redacción (en este caso sería muy fácil que los alumnos engañasen al sistema), sino de determinar con cuánta exactitud usan esas palabras clave para definir cada concepto», apuntó el coordinador del proyecto.

Esto, a su vez, precisa tecnología de PLN con un elevado umbral de tolerancia a fallos, capaz de comprender que dos vocablos con ortografías distintas, o con faltas ortográficas, pueden ser sinónimas, y también que una misma palabra puede ser polisémica (tener distintos significados según el contexto).

«El sistema debe ser "consciente" de que "web cam" y "cámara web" significan lo mismo, y distinguir si la palabra "Java" se refiere a una isla o a un lenguaje de programación; es decir, tiene que discernir el contexto», señaló el Dr. Greller.

Tanto las herramientas de análisis del nivel inicial como las del desarrollo de conceptos fueron probadas por Bit Media, entidad asociada al proyecto LTfLL. Se trata de un proveedor austriaco de sistemas de educación virtual que imparte cursos para ayudar a parados a encontrar empleo formándoles en ofimática para obtener el llamado carnet ECDL (Acreditación Europea de Manejo de Ordenador), un certificado de dominio de tecnologías de la información y la comunicación (TIC).

Mejorar el rendimiento del PLN

Por lo que se refiere a mejorar el rendimiento de los sistemas de PLN, los investigadores de LTfLL aplicaron un análisis semántico latente y técnicas de preprocesado y conformaron entornos contextuales para distintas materias.

«Una de las principales dificultades en el PLN, desde el punto de vista técnico, es que requiere una gran cantidad de potencia de procesamiento. Cada vez que un alumno introduce información o formula una consulta, tiene que realizarse una ingente tarea de procesamiento. Pero pueden obtenerse resultados en cuestión de segundos (y no de días) si previamente se determina el entorno contextual y se realiza un procesamiento previo de muchos de los términos empleados en determinado campo, como pueden ser la medicina o la informática», aseguró el Dr. Greller. «Esta es una cuestión determinante para nosotros, ya que queríamos que nuestras herramientas funcionasen "a voluntad" y a una velocidad lo más próxima posible al tiempo real.»

La labor realizada por los investigadores de LTfLL para mejorar la tecnología de PLN ha generado unos resultados que se sitúan a la vanguardia del campo incipiente de la «analítica del aprendizaje», que se dedica a medir, recoger, analizar y facilitar información sobre los alumnos y sus circunstancias con el fin de comprender con mayor claridad el aprendizaje y su entorno y optimizar todo ello. Un aspecto determinante de lo anterior es la combinación del PLN con otras tecnologías dedicadas al «sentiment analysis» (análisis de sentimientos o pareceres) y la comunicación mediante redes sociales, con el fin de conseguir que el aprendizaje en cualquier disciplina y sobre cualquier materia resulte más divertido, interactivo y entretenido.

La investigación realizada en LTfLL fue posible gracias a fondos concedidos a través del Séptimo Programa Marco (7PM) de la Unión Europea.

Enlaces útiles:

- sitio web de LTfLL
- ficha informativa del proyecto LTfLL en CORDIS

Artículos relacionados:

- Reportaje - Herramientas de procesamiento del lenguaje al servicio de docentes y alumnos
- Un acceso más fácil a la información gracias a bases de datos activadas por la voz
- Proyecto TIC para potenciar la interacción hombre-máquina

Información relacionada

Síganos en: RSS Facebook Twitter YouTube Gestionado por la Oficina de Publicaciones de la UE Arriba