Objetivo
The main objective is to develop a multilingual natural language access system to library catalogues. It will enable users to enter queries in different European languages (initially these will be German, English, French and Spanish) and it will analyse bibliographic information expressed in these languages, extracting keywords to be translated into a language selected by the user. Work on this project may also set future standards for linguistic treatment of library data.
Impact and expected results
CANAL/LS will considerably enhance accessibility of European multilingual library catalogues, using linguistic techniques to ensure that enquiries will result in all applicable responses regardless of language.
It will also help set future standards for linguistic treatment of library data.
Deliverables The fully integrated software package prototype is the main deliverable of the project.
To be publicly available, in line with project progress, will be:
Publications on project results;
A report on domain selection and user requirements;
The interface definition;
Design and architecture report;
Monolingual and bilingual dic-tionary report;
An evaluation of the prototype;
Final report.
Technical approach:
The central component of the system will be a "linguistic server" communicating with library automation systems ("clients") via a protocol to be defined. Messages exchanged between the library systems and the linguistic server will be in SGML format. The linguistic server may be based on different "linguistic engines" of different capabilities and employing different dictionaries. Two versions will be prototyped initially. The server will be "open" in so far as it allows for accommodation of additional languages and additional library systems.
The project has nine workpackages, focusing on software, linguistic and library problems, as follows:
User requirements and domain selection to ascertain user needs for multilingual bibliographic record retrieval and to choose a topic area to keep test dictionaries within practical limits;
Library system/linguistic server interface definition between library systems and linguistic server;
Linguistic server design and architecture of the linguistic server, including specifications of all functions and environment;
Linguistic server development/ library system interface modifying two linguistic systems, SX and EXTRAKT, to interpret SGML-encoded messages from the library system and perform the corresponding actions;
Library system adaptation of BABSY and SABINE participators with interfaces and expanded OPACs;
Dictionary generation - mono and bilingual for French, Spanish, German and English;
Software integration into proto-types for BABSY and SABINE;
System installation and indexing at two sites, linking to OPACs and re-indexing domain records;
Evaluation against initial user requirements.
The dissemination of information will be via conferences and library-specific events, trade fairs, electronic articles, scientific and technical press and at a specially convened workshop.
Key issues:
The primary element of the project is a linguistic server, developed as a "black box" to communicate with library systems. Key issues include:
A client-server protocol (for standardisation) for message exchange between library client systems and the linguistic server;
Data exchange format based on SGML (Standard Generalised Markup Language ISO 8879), for client-server communications;
Preparation of linguistic data (mono and bilingual dictionaries) and suitable tools for linguistic analysis of bibliographic data;
Inclusion of linguistic software and data collections from various European (ESPRIT) and national (DFG, Germany) programmes;
Integration of the linguistic server into library environments.
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..
- ciencias naturales informática y ciencias de la información software
- ingeniería y tecnología ingeniería eléctrica, ingeniería electrónica, ingeniería de la información ingeniería electrónica sistemas de automatización y control
- humanidades otras humanidades biblioteconomía
- ciencias sociales sociología relaciones laborales automatización
- ciencias naturales informática y ciencias de la información ciencia de datos intercambio de datos
Para utilizar esta función, debe iniciar sesión o registrarse
Le pedimos disculpas, pero se ha producido un error inesperado durante la ejecución.
Necesita estar autentificado. Puede que su sesión haya finalizado.
Gracias por su comentario. En breve recibirá un correo electrónico para confirmar el envío. Si ha seleccionado que se le notifique sobre el estado del informe, también se le contactará cuando el estado del informe cambie.
Programa(s)
Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.
Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.
Tema(s)
Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.
Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.
Convocatoria de propuestas
Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.
Datos no disponibles
Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.
Régimen de financiación
Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.
Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.
Datos no disponibles
Coordinador
92817 Puteaux
Francia
Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.