Servicio de Información Comunitario sobre Investigación y Desarrollo - CORDIS

Los archivos en papel, pasados al ordenador

El archivado de recortes de prensa ha exigido, hasta ahora, una interminable labor de recorte manual, encolado y clasificación de artículos en archivos de papel. Afortunadamente, estos métodos arcaicos tienen los días contados, ante la próxima modernización del proceso entero. Y es que con la integración de la herramienta informática de captura de imágenes LAURIN, no sólo se automatizará, digitalizará y racionalizará el proceso, sino que además se integrará en una base de datos, disponible electrónicamente a través de las redes.
Los archivos en papel, pasados al ordenador
El paquete de software LAURIN incluye cuatro herramientas útiles para la selección, el tratamiento y la tipificación de artículos de prensa.

La primera herramienta de LAURIN, LibClip, consiste en el verdadero sistema de adquisición de imágenes. Desarrollado por una empresa austriaca, LibClip tiene como función fundamental escanear formatos de página de A4 a A0 y extraer del conjunto de los datos de la página el artículo que se quiera copiar, sin alterar el formato ni el aspecto originales del artículo. A continuación, se somete el texto a un proceso de corrección y tratamiento de reconocimiento óptico de caracteres (OCR), con el fin de prepararlo para su importación en una base de datos a través de la pasarela ODBC. Hay más, este proceso automatizado hace posible asimismo el registro de referencias bibliográficas, tales como títulos, autores, pies, etc.

El segundo eje del paquete de software LAURIN lo pone la herramienta de indización y base de datos local. Basada en los sistemas de gestión de bases de datos ORACLE 8i, ha sido diseñada para plataformas Windows NT y Windows 98. Tiene como principal función administrar la indización de artículos y la asignación a éstos de términos del tesauro.

La aplicación central de LAURIN es el tercer programa, que contiene las herramientas de tesauro y gestión del tesauro. Puesto a punto por la Universidad de Innsbruck, ha sido diseñado para atender criterios de funcionalidad multilingüe absoluta; muestra un número de usos importantes, entre los cuales conviene destacar la compilación de datos con esquemas interrelacionados. Así, se podrán establecer, entre otras cosas, referencias cruzadas entre nombres de personas y ubicaciones geográficas e instituciones, conectando además aquellos con epígrafes. Actualmente, LAURIN tiene almacenados unas 30.000 personas, 6.000 materias y 200.000 entradas, para un total de 540.000 correspondencias empleadas.

Finalmente, el programa IV de LAURIN presenta una interfaz de búsqueda, herramienta imprescindible de toda base de datos que se precie. Hasta la fecha, la búsqueda se ha venido efectuando exclusivamente a través de una interfaz HTML; sin embargo, se han emprendido trabajos de incorporación, en el sistema, de recursos adicionales de búsqueda avanzada.

Ya por último, cabe señalar que LAURIN incluye funciones de arrastrar y soltar gráficas con fines de pretratamiento de los datos de artículos, de acuerdo con cualquier criterio definido (fecha de publicación, asunto, número de página e incluso contenido de la imagen), de construcción de un facsímil electrónico exacto del artículo con referencias cruzadas intactas y de conformidad con las normas ISO, y de configuración de un canal infalible de incorporación de esta información en una base de datos electrónica consultable.

Información relacionada

Informe resumido

Número de registro: 80284 / Última actualización el: 2005-09-18
Dominio: TI, Telecomunicaciones
Síganos en: RSS Facebook Twitter YouTube Gestionado por la Oficina de Publicaciones de la UE Arriba