European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Contenido archivado el 2024-05-24

Ontology driven Temporal Text Mining on Organisational Data for Extracting Temporal Valid Knowledge

Article Category

Article available in the following languages:

Evaluación de prácticas de minería de textos

Conforme la minería del conocimiento se convierte en un elemento esencial para el funcionamiento fluido de las organizaciones modernas, continuamente se están desarrollando herramientas específicas para la anotación de datos textuales. Dirigido a expertos en dominios, cuya tarea principal es la revisión manual de las anotaciones, el sistema Parménides fue desarrollado como una alternativa atractiva para la anotación de datos textuales.

Economía digital icon Economía digital

El sistema Parménides fue diseñado para servir de soporte a todo el proceso de minería de textos, desde la recopilación de documentos, pasando por la extracción de información y la anotación semántica hasta la aplicación de técnicas de minería de datos. Al tener una base ontológica, incluye un sistema de gestión de ontologías y herramientas de extracción de nuevos conceptos y relaciones, además de contar con funciones para el almacenamiento de documentos y datos. Aunque el sistema Parménides puede soportar todo el proceso de minería de textos, los usuarios también pueden emplear solo un subconjunto de las funciones disponibles, dependiendo de la tarea que deseen llevar a cabo. Durante la vigencia del proyecto PARMENIDES y en paralelo con el desarrollo del propio sistema, se desarrolló un marco de evaluación en colaboración con los usuarios. El objetivo primordial de este ejercicio emprendido por los socios del proyecto PARMENIDES era doble. Primero, intentaron llevar a cabo una evaluación completa centrada en el usuario de la arquitectura del sistema y evaluar cómo de bien respondía a las necesidades de los usuarios. Segundo, el marco general diseñado para el sistema Parménides estaba pensadso para poder ser reutilizado para evaluar sistemas similares. En particular, se empleó la herramienta de orden relativo (ROTE) para elaborar un modelo de calidad parametrizado para la evaluación. Fue diseñado en la Universidad de Ginebra para ayudar a los usuarios a especificar la importancia relativa de diversas características de calidad y métricas asociadas. La herramienta permite a los usuarios ordenar varias características de la calidad comparándolas por pares. Por ejemplo, un usuario puede considerar obligatorio tanto un sistema de gestión de ontologías como la función para construir y mantener ontologías. Sin embargo, el rendimiento de herramientas específicas para adquirir conceptos nuevos puede caracterizarse como menos importante que la calidad del sistema de gestión. Este marco de evaluación para un sistema de minería de textos grande y complejo dio como resultado un modelo de calidad que contiene más de 180 métricas. Fue esta complejidad del modelo de calidad la que en un principio propició el desarrollo de la herramienta ROTE. Sin embargo, antes de poder evaluar sus beneficios generales, será necesario seguir probando otros sistemas de complejidad diversa.

Descubra otros artículos del mismo campo de aplicación