Service Communautaire d'Information sur la Recherche et le Développement - CORDIS

Scanner les archives sur support papier

Jusqu'à présent, l'archivage des journaux demandait beaucoup de temps, car il fallait découper, coller et trier manuellement les articles pour les archiver sur support papier. Heureusement, des améliorations permettront bientôt d'abandonner ces méthodes archaïques et de faire place à une modernisation de l'ensemble du processus. Grâce au développement du logiciel LAURIN, un outil de saisie d'images, l'intégralité du processus est automatisée, numérisée et simplifiée, et les archives vont alimenter des bases de données accessibles électroniquement par l'intermédiaire des réseaux.
Scanner les archives sur support papier
La solution logicielle LAURIN s'articule autour de quatre modules utiles destinés à aider les archivistes de journaux à sélectionner, traiter et classer les articles de journaux.

Le module LAURIN Software I, connu sous le nom de LibCLip, est le système actuel d'acquisition d'images. Développé par une société autrichienne, LibClip sert essentiellement à scanner des pages de formats A4 à A0, à copier efficacement l'article requis en l'isolant du reste de la page, tout en conservant le format et l'apparence d'origine de l'article intacts. L'article est ensuite corrigé et traité à l'aide de techniques OCR (reconnaissance optique de caractères) avant d'être importé dans une base de données par l'intermédiaire de la passerelle ODBC. De plus, ce processus automatisé permet d'enregistrer les références bibliographiques comme le titre, l'auteur, la légende…

Le module LAURIN Software II constitue la base de données locale et l'outil d'indexation. Basé sur les systèmes de gestion de bases de données ORACLE 8i, il a été conçu pour tourner sur les plates-formes Windows NT et Windows 98. Sa fonction principale est de gérer l'indexation des articles et de leur attribuer des mots-clés.

Application centrale de la solution LAURIN, le module Software III se compose du Thésaurus et des outils servant à sa gestion. Développé par l'université d'Innsbruck, il a été conçu sur une base parfaitement multilingue et fournit une série de fonctionnalités importantes, y compris celles permettant de compiler les données en les reliant entre elles par des liens. Par exemple, les noms de personnes peuvent être mis en relation avec des lieux géographiques ou des organismes et être ensuite reliés à des titres thématiques. Actuellement, LAURIN regroupe 30000 personnes, 6000 thèmes et 200000 entrées géographiques, pour un total de 540000 liens utilisés.

Le dernier module, LAURIN Software IV, est l'interface de recherche. Quelle base de données pourrait être complète sans cette fonctionnalité importante? A ce jour, la recherche est basée seulement sur une interface HTML, mais des améliorations sont en cours pour doter le système de fonctionnalités de recherche plus élaborées.

Enfin, le logiciel LAURIN fournit des fonctionnalités graphiques "glisser-déplacer" permettant de pré-travailler les données de l'article (selon tout type de critère souhaité, comme la date de publication, le numéro, le nombre de pages et même le contenu de l'image), d'effectuer une reproduction électronique exacte de l'article, de le doter de références croisées conformes aux standards ISO, et offre des outils très efficaces pour entrer ces informations dans une base de données électroniques dotée d'une fonction de recherche.

Informations connexes

Résumé de rapport

Numéro d'enregistrement: 80284 / Dernière mise à jour le: 2005-09-18
Domaine: TI, Télécommunications