European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Article Category

Article à la une
Contenu archivé le 2024-04-23

Article available in the following languages:

En vedette - Numériser la culture pour la rendre plus accessible

La numérisation de masse requiert que les bibliothèques nationales, musées et centres d'archivage scannent leurs collections et créent des transcriptions électroniques. Un projet financé par l'UE vient de créer un centre européen par le biais duquel les institutions peuvent contacter des experts, leur offrant une consultance et un soutien pour des technologies sophistiquées au profit de leurs programmes de numérisation.

Économie numérique icon Économie numérique

L'Europe jouit d'un passé culturel riche, mais jusqu'à récemment, la majorité de ces œuvres étaient inaccessibles. Des millions de livres, documents et autres ouvrages imprimés sont conservés dans des boîtes d'archives ou des étagères poussiéreuses, soigneusement conservés dans des musées, bibliothèques nationales et services d'archivage. Seuls quelques-uns de ces documents voient la lumière du jour et rares sont les heureux privilégiés qui ont l'autorisation de feuilleter ces précieux vestiges du passé pour en dévoiler les secrets. Mais avec la numérisation de masse, tout cela fera partie de l'histoire ancienne. Pour plus d'une dizaine d'années, la Commission européenne a mené une campagne en vue de créer une bibliothèque numérique paneuropéenne. Les institutions culturelles ont été encouragées (si pas obligées) à numériser leurs collections. Pour les documents imprimés, cette numérisation peut être faite en masse. Ainsi, des millions de documents et ouvrages ont été numérisés, automatiquement transcrits, et enfin inventoriés pour un accès plus aisé, via Europeana, le portail central de la bibliothèque numérique européenne. Le projet du 7e PC, IMPACT («Improving access to text»,) a passé quatre ans et demi à soutenir cet effort. Ses partenaires technologiques ont développé une suite d'outils logiciels post-numérisation pour améliorer la fidélité des transcriptions numériques . Toutefois, Hildelies Balk, coordinatrice du projet, avance que les progrès technologiques seuls ne suffisent pas. «La numérisation de masse est une tâche de grande envergure; nous avons déjà des millions de pages disponibles électroniquement et en ligne, mais cela ne représente qu'une petite fraction, probablement à peine 1% des matériaux historiques préservés. La numérisation de masse a besoin de soutien: les institutions désirent des directives sur les meilleures technologies à utiliser, un soutien pour le développement d'outils dans leur environnement productif et une assistance dans le développement et la gestion de programmes de numérisation. Il s'agit d'un gros problème pour la majorité des bibliothèques, musées et centres d'archivage en Europe.» Ainsi, IMPACT a complété ses développements technologiques avec des efforts visant à soutenir la direction stratégique de la numérisation de masse et construire la capacité des institutions à participer effectivement dans ce domaine. Le projet a offert une formation et un soutien au personnel impliqué dans la numérisation de masse. Il a également offert un help desk faisant office d'un intermédiaire, transférant les requêtes des utilisateurs aux partenaires de projet et aux experts de numérisation. Un programme de formation établi portant sur les questions de numérisation à grande échelle et les technologies associées a également été mis en place sur le site web du projet. L'un des accomplissements les plus importants du projet a toutefois été le développement d'un cadre, ou architecture, technologique pour rassembler tous les outils et technologies de numérisation de masse à un seul endroit et s'assurer ainsi que les technologies, commercialement disponibles et celles développées par Impact, par exemple, soient compatibles. «L'architecture que nous proposons, qui a été adoptée par tous les partenaires du projet, joue le rôle de liant entre tous les éléments», explique Clemens Neudecker, responsable technique d'IMPACT. «Elle permet aux utilisateurs d'intégrer différentes technologies et méthodes de traitement et d'offrir une interface graphique pour une meilleure gestion des projets. Il est possible d'ajouter n'importe quel logiciel ou outil de traitement dans l'architecture, et de faire glisser et de déplacer les fichiers par une séquence d'outils afin de mieux définir et améliorer les transcriptions électroniques.» Le cadre d'IMPACT offrira aux bibliothèques, musées et centres d'archivage débutant dans les projets de numérisation des informations commerciales importantes. Une suite d'outils d'évaluation et de ressources les aidera à décider de la combinaison la plus effective parmi les outils disponibles pour leurs collections. «Nous voulions permettre aux bibliothèques et centres d'archives de choisir le logiciel ou système désiré et l'ordre selon lequel il serait exécuté», commente M. Neudecker. «Nous désirions supprimer tout souci de formats, de conversion ou d'interopérabilité. Le cadre gère tous ces paramètres, en plus de l'échelonnabilité.» Le projet IMPACT s'est clôturé en juin 2012, mais l'expertise collective des partenaires et leurs expériences d'utilisation et de développement d'outils de numérisation sont désormais ouvertes à la communauté de numérisation de masse par le centre de compétence d'IMPACT. L'administration quotidienne du centre et de son help desk sera gérée par la bibliothèque virtuelle Miguel de Cervantes et par l'université d'Alicante, en Espagne. L'infrastructure et le stockage informatique seront fournis par le centre de mise en réseau et de superinformatique de Poznan, en Pologne. Le principal ensemble de données du projet IMPACT est hébergé par l'institut PRIMA de l'université de Salford, au Royaume-Uni, et compte désormais plus de 500 000 images numériques issues des bibliothèques partenaires du projet avec plus de 50 000 représentations de réalité de terrain. «Les partenaires d'IMPACT sont engagés à poursuivre dans cette lancée», commente le Dr Balk. «Nous avons développé une telle ressource d'expertise au cours du projet qu'il serait bon de la mettre à disposition des institutions et leur permettre ainsi de mener à bien leur projet de numérisation. Le centre de compétence IMPACT rassemble trois principales communautés dans ce domaine: les détenteurs de contenus, les chercheurs impliqués dans le domaine des sciences de l'image, des technologies du langage et de reconnaissance optique de caractères, et les fournisseurs de services de numérisation de masse, par les distributeurs de logiciels de reconnaissance optique de caractères, désireux de s'impliquer dans la communauté de la numérisation.» Ces trois communautés bénéficient des interactions avec d'autres entités. Le centre est financé par les inscriptions coûtant près de 10 000 euros pour les entités ou entreprises privées et 6000 euros pour les entités publiques. Lorsque les membres contactent le centre pour un conseil, un soutien ou tout autre service, ils sont redirigés vers les ressources, outils et institutions d'experts adéquats parmi les partenaires du projet. «Il est impossible de procéder à la numérisation de masse en solo», conclut le Dr Balk. «La coopération est vitale et les partenaires d'IMPACT possèdent des années d'expériences de collaboration dans le domaine. Par le centre de compétences, nous sommes préparés à partager nos connaissances et expériences avec d'autres et à progresser dans cette optique de réellement ouvrir la richesse des ressources historiques que possède l'Europe.» Le projet IMPACT a reçu un financement de la recherche de 12,1 millions d'euros (sur un total de 17,1 millions d'euros) au titre du programme de TIC du septième programme-cadre (7e PC) de l'UE. Liens utiles: - Site web du projet «Improving access to text» - Fiche d'information du projet IMPACT sur CORDIS - ICT Challenge 4: Digital libraries and content - Impact Centre of Competence - Europeana Articles connexes: - En vedette: De la page imprimée aux bits: de nouveaux outils pour la numérisation de masse - En vedette: numériser notre patrimoine culturel