Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Workflows for the Large-Scale Collection and Transference of Knowledge across Languages: Using Natural Language Processing to Produce High-Quality Contents with Language Learners

Descripción del proyecto

Nueva transferencia de flujo de trabajo en varias lenguas para crear contenido a gran escala

La traducción de lenguas es una tarea compleja, ya que es difícil encontrar un equivalente de cada palabra cuando se transfiere contenido de una lengua a otra, debido a que cada idioma tiene su propio sistema para transmitir conceptos. El proyecto WIKOLLECT, financiado con fondos europeos, estudiará este tema valiéndose de la sinergia entre el procesamiento del lenguaje natural, el aprendizaje de lenguas y la colaboración masiva. Desarrollará un flujo de trabajo especial para la transferencia a gran escala de contenidos de alta calidad entre distintas lenguas, que incluye cuatro etapas cíclicas para identificar automáticamente el contenido en la lengua de origen que falta en la de destino y generar posibles traducciones. Este flujo de trabajo del proyecto se aplica en italiano y alemán a «Wikcionario», el diccionario en línea multilingüe de contenido libre, y fomentará la reutilización justa de los contenidos en todos los idiomas, además de facilitar la transferencia de conocimientos.

Objetivo

WiKollect aims at creating a workflow for the large-scale transference of high-quality contents across languages. The workflow is divided in four cyclic steps. In step (i) an automatic model will identify contents available in a document in language A which are missing in a document, on the same topic, in language B. In step (ii) candidates to fill the gaps in the document in language B will be automatically generated. In step (iii) such candidates will be subject to manual evaluation by language learners. In step (iv) the contents identified as high-quality will be promoted to fill the gaps in the document in language B. WiKollect will take advantage of the barely-exploited synergy among natural language processing, language learning, and crowdsourcing. To address the different research challenges posed by the workflow design and implementation, it will create an innovative and re-usable hybrid intelligence architecture combining (a) artificial intelligence —such as machine learning and natural language processing— to identify contents worth transferring across languages and generate potential translations and (b) human intelligence —by means of implicit crowdsourcing— relying on a crowd of language learners to flag good contents. WiKollect will create different by-products in addition to the research products that will be generated by addressing each step in the four-step workflow. Language learning exercises on specific topics and complexity levels will be generated. The fair re-use of contents across languages will be promoted with the mass production of high-quality contents. During the MSC period, WiKollect will target the generation of Wiktionary contents in Italian and German. Still, the workflow is flexible and extendable and can be applied to other documents (e.g. Wikipedia articles, news) and languages in the near future.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

MSCA-IF - Marie Skłodowska-Curie Individual Fellowships (IF)

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) H2020-MSCA-IF-2018

Ver todos los proyectos financiados en el marco de esta convocatoria

Coordinador

ACCADEMIA EUROPEA DI BOLZANO
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 183 473,28
Dirección
VIALE DRUSO 1
39100 BOLZANO
Italia

Ver en el mapa

Región
Nord-Est Provincia Autonoma di Bolzano/Bozen Bolzano-Bozen
Tipo de actividad
Research Organisations
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

€ 183 473,28
Mi folleto 0 0