European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Common Language Resources and Technology Infrastructure

Article Category

Article available in the following languages:

Herramientas de procesamiento de datos lingüísticos basadas en web

Científicos financiados con fondos europeos reunieron distintas herramientas de procesamiento digital de datos del lenguaje y el habla dentro de una arquitectura basada en web con la que pueden trabajar tanto expertos en humanidades sin un elevado conocimiento técnico como aquellos dedicados a campos tradicionalmente más complejos en estas artes.

Salud icon Salud

El lenguaje distingue a los humanos del resto de seres vivos. El conocimiento de la estructura, el uso y la evolución del lenguaje y del habla permite desentrañar temas tan diversos como los patrones de migración históricos o los criterios para el desarrollo de buscadores web. El procesamiento del lenguaje y del habla es un campo multidisciplinario que abarca campos como la lingüística, la psicología, la cognición y el procesamiento neuronal, la informática, la ingeniería biomédica y las matemáticas. Científicos europeos dedicados a las ciencias sociales y humanidades (CSH) pusieron en marcha el proyecto Clarin («Infraestructura común de tecnología y recursos lingüísticos») para crear una infraestructura unificada de herramientas y datos relacionados con el lenguaje. No pretendían crear nuevos conocimientos, sino utilizar los múltiples recursos nacionales y europeos ya existentes. De esta forma se propusieron sentar las bases para la unificación de las herramientas y los datos disponibles en un entorno común accesible para la comunidad científica al completo. La arquitectura de datos distribuidos diseñada sirvió para generar servicios web para científicos y permitió a los usuarios no expertos realizar tareas complejas con las que aprovechar las múltiples herramientas de procesamiento del lenguaje y del habla creadas de unos años a esta parte. Así, gracias a la creación del «Observatorio Virtual del Lenguaje» (Virtual Language Observatory, VLO, http://www.clarin.eu/vlo/) se publicaron datos resumidos y analizados sobre todos los recursos y las herramientas de los socios de Clarin. Una buena parte de la comunidad dedicada a las CSH es ajena a las herramientas y las tecnologías de procesamiento lingüísticas debido a su tradición menos orientada a la tecnología, y por tanto la labor de acercamiento de Clarin resulta positiva e importante. Además de los aspectos técnicos, el equipo al cargo del proyecto trató sobre la futura administración y financiación del sistema e investigó distintos modelos jurídicos, financieros y organizativos posibles. Los socios lograron el apoyo de una amplia comunidad científica dedicada a las CSH para que contribuyeran a cimentar una infraestructura de recursos y herramientas unificada. El acceso a esta enorme cantidad de datos y herramientas permitirá que los científicos innoven en el estudio de temas tradicionales. Además podrán formular nuevas hipótesis que hasta ahora se situaban fuera de sus capacidades debido a las limitaciones en los datos y la tecnología. La infraestructura de Clarin allanó el camino para que surjan nuevas interpretaciones interesantes en el campo del procesamiento del habla y del lenguaje.

Descubra otros artículos del mismo campo de aplicación