European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Article Category

Story
Contenido archivado el 2024-04-23

Article available in the following languages:

Reportaje - Una cultura accesible en formato digital

La digitalización masiva precisa que las bibliotecas nacionales, los museos y los archivos escaneen sus fondos y realicen una labor de transcripción electrónica de los mismos. Un proyecto financiado con fondos de la Unión Europea acaba de crear un centro europeo en el que distintas instituciones pueden comunicarse con expertos, recibir consejo y acceder a tecnologías de última generación a modo de apoyo a sus programas de digitalización.

Economía digital icon Economía digital

Europa posee un patrimonio histórico-cultural de gran valor pero hasta hace poco tiempo el acceso a gran parte del mismo estaba fuertemente limitado. Millones de libros, documentos y otros tipos de material impreso se almacenaban en las cajas y las estanterías de los departamentos de conservación de museos, bibliotecas nacionales y archivos. Sólo una fracción de ellos se exponían y únicamente algunos investigadores tenían permiso para desempolvar y descubrir estas gemas ocultas. Pero la situación está cambiando gracias a la digitalización masiva. La Comisión Europea ha encabezado una campaña que dura ya más de un decenio destinada a crear una biblioteca digital paneuropea y ha animado enérgicamente a las instituciones culturales a que digitalicen sus fondos. En el caso del material impreso el proceso puede realizarse en masa. Así, se han escaneado y transcrito de forma automática millones de palabras impresas y se han introducido en Europeana, el portal central de la biblioteca digital europea que permite acceder a estos fondos y realizar búsquedas en ellos. El proyecto perteneciente al 7PM Impact «Mejora del acceso al texto» ha empleado cuatro años y medio en apoyar esta labor. Sus socios tecnológicos han desarrollado un paquete de herramientas de tratamiento de documentos tras su escaneado para mejorar la fidelidad de las transcripciones digitales . No obstante, Hildelies Balk, coordinadora del proyecto, admite que los progresos tecnológicos no bastan por sí solos. «La digitalización masiva es una tarea de enorme magnitud. Ya contamos con millones de páginas disponibles en formato electrónico y a través de Internet, pero esta cantidad sólo supone una fracción diminuta, puede que sólo el 1 %, del material histórico conservado. La digitalización masiva precisa de apoyos: es necesario guiar a las instituciones sobre las tecnologías idóneas, apoyarlas en la aplicación de herramientas en su entorno productivo y ayudarles a establecer y gestionar los programas de digitalización. Es un verdadero problema para la mayoría de bibliotecas, museos y archivos de Europa.» Impact ha complementado el progreso tecnológico logrado con iniciativas destinadas a apoyar la estrategia de la digitalización masiva y crear en las instituciones la capacidad de contribuir con efectividad en este empeño. El proyecto ha aportado formación y apoyo a la plantilla encargada de las labores de digitalización en masa. Impact puso a su disposición un servicio de asistencia que ejerció labores de intermediario entre las solicitudes de los usuarios y los socios del proyecto y otros expertos en digitalización. También se publicó en la página web del proyecto un programa de formación asentado dedicado a temas y tecnologías de digitalización a gran escala. Uno de los logros principales del proyecto fue el desarrollo de un marco tecnológico (arquitectura) que reúne en un único emplazamiento todas las herramientas y tecnologías necesarias para la digitalización masiva y que garantiza que las tecnologías, tanto las comerciales como las desarrolladas por Impact, sean compatibles. «La arquitectura propuesta, ya adoptada por todos los socios del proyecto, es el cemento que mantiene unidos todos los componentes», explicó Clemens Neudecker, gestor técnico de Impact. «En ella se pueden integrar tecnologías y métodos de procesamiento muy distintos y ofrece una interfaz gráfica para facilitar la gestión de los proyectos. Permite añadir cualquier tipo de software o de herramientas de procesamiento preexistentes a la arquitectura y simplemente arrastrar ficheros hacia una secuencia de herramientas para perfeccionar y mejorar las transcripciones electrónicas.» El marco de Impact aportará información comercial relevante a bibliotecas, museos y archivos que acaban de comenzar un proyecto de digitalización. Un conjunto de recursos y herramientas de evaluación les permitirá decidirse por la combinación más efectiva de herramientas para un fondo concreto. «Tratamos de que las bibliotecas y los archivos contasen con la posibilidad de elegir el software o los sistemas que deseen en el orden que mejor les convenga», continuó el Sr. Neudecker. «Nuestra intención es que no tengan que preocuparse por los formatos de archivo, las conversiones ni la compatibilidad. El marco gestiona todos estos aspectos y resuelve las dificultades que emanan de la escalabilidad.» El proyecto tocó a su fin en junio de 2012, pero en la actualidad los conocimientos acumulados por los socios y sus experiencias con el uso y desarrollo de herramientas de digitalización se están dando a conocer a todo el colectivo interesado en la digitalización masiva a través del Centro de Competencia de Impact. La administración diaria del centro y de su servicio de asistencia recaerá sobre la Biblioteca Virtual Miguel de Cervantes de la Universidad de Alicante (España). La infraestructura de computación y almacenamiento correrá a cargo del Centro de Supercomputación y Redes de Poznan (Polonia). El alojamiento del corpus principal del proyecto Impact lo gestiona el Instituto PRIMA de la Universidad de Salford (Reino Unido) y en él ya se encuentran más de 500 000 imágenes digitales de las bibliotecas asociadas a Impact y más de 50 000 representaciones cotejadas con el original. «Los socios de Impact se han propuesto mantener el ritmo alcanzado», indicó la Dra. Balk. «Hemos acumulado mucha experiencia en el transcurso del proyecto y queremos divulgarla para ayudar a otras instituciones en sus proyectos de digitalización masiva. El Centro de Competencia de Impact reúne a las tres comunidades más importantes del sector: depositarios de contenidos; investigadores dedicados a la ciencia de la imagen, la tecnología de reconocimiento óptico de caracteres (OCR) y la tecnología lingüística y proveedores de servicios de digitalización masiva como distribuidores de programas de OCR interesados en cooperar con la comunidad dedicada a la digitalización.» Los tres colectivos se benefician de la interacción con el resto. La financiación del Centro de Competencia se basa en suscripciones que ascienden a 10 000 euros para organismos privados y 6 000 para entidades públicas. Cuando los miembros contactan con el centro para solicitar consejo, apoyo o servicios se les dirige hacia los recursos, las herramientas y las instituciones expertas más adecuadas del grupo de socios de Impact. «No es posible realizar una labor de digitalización masiva en solitario», concluyó la Dra. Balk. «La cooperación es vital y los socios de Impact poseen años de experiencia en la colaboración en este campo. Gracias al Centro de Competencia estamos preparados para compartir nuestros conocimientos y experiencia y sacar adelante esta interesante idea con la que se pondrá a la vista la innumerable cantidad de recursos históricos con que cuenta Europa.» La investigación del proyecto Impact se realizó con una dotación de 12,1 millones de euros (de un presupuesto total de 17,1 millones de euros) procedente del Séptimo Programa Marco (7PM) de la UE, a través del tema de TIC. Enlaces útiles: - sitio web del proyecto Impact - ficha informativa del proyecto Impact en CORDIS - Centro de Competencia de Impact - «Desafío 4 de TIC: Bibliotecas y contenidos digitales» - Centro de Competencia de Impact - Europeana Artículos relacionados: - Reportaje - De la hoja impresa a los bits: nuevas herramientas al servicio de la digitalización en masa - Reportaje - El patrimonio cultural en formato digital