Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS
Inhalt archiviert am 2024-04-19

Catalogue with Multilingual Natural Language Access / Linguistic Server

Ziel

The main objective is to develop a multilingual natural language access system to library catalogues. It will enable users to enter queries in different European languages (initially these will be German, English, French and Spanish) and it will analyse bibliographic information expressed in these languages, extracting keywords to be translated into a language selected by the user. Work on this project may also set future standards for linguistic treatment of library data.
Impact and expected results

CANAL/LS will considerably enhance accessibility of European multilingual library catalogues, using linguistic techniques to ensure that enquiries will result in all applicable responses regardless of language.
It will also help set future standards for linguistic treatment of library data.

Deliverables The fully integrated software package prototype is the main deliverable of the project.

To be publicly available, in line with project progress, will be:

Publications on project results;
A report on domain selection and user requirements;
The interface definition;
Design and architecture report;
Monolingual and bilingual dic-tionary report;
An evaluation of the prototype;
Final report.
Technical approach:

The central component of the system will be a "linguistic server" communicating with library automation systems ("clients") via a protocol to be defined. Messages exchanged between the library systems and the linguistic server will be in SGML format. The linguistic server may be based on different "linguistic engines" of different capabilities and employing different dictionaries. Two versions will be prototyped initially. The server will be "open" in so far as it allows for accommodation of additional languages and additional library systems.

The project has nine workpackages, focusing on software, linguistic and library problems, as follows:

User requirements and domain selection to ascertain user needs for multilingual bibliographic record retrieval and to choose a topic area to keep test dictionaries within practical limits;
Library system/linguistic server interface definition between library systems and linguistic server;
Linguistic server design and architecture of the linguistic server, including specifications of all functions and environment;
Linguistic server development/ library system interface modifying two linguistic systems, SX and EXTRAKT, to interpret SGML-encoded messages from the library system and perform the corresponding actions;
Library system adaptation of BABSY and SABINE participators with interfaces and expanded OPACs;
Dictionary generation - mono and bilingual for French, Spanish, German and English;
Software integration into proto-types for BABSY and SABINE;
System installation and indexing at two sites, linking to OPACs and re-indexing domain records;
Evaluation against initial user requirements.

The dissemination of information will be via conferences and library-specific events, trade fairs, electronic articles, scientific and technical press and at a specially convened workshop.

Key issues:

The primary element of the project is a linguistic server, developed as a "black box" to communicate with library systems. Key issues include:

A client-server protocol (for standardisation) for message exchange between library client systems and the linguistic server;
Data exchange format based on SGML (Standard Generalised Markup Language ISO 8879), for client-server communications;
Preparation of linguistic data (mono and bilingual dictionaries) and suitable tools for linguistic analysis of bibliographic data;
Inclusion of linguistic software and data collections from various European (ESPRIT) and national (DFG, Germany) programmes;
Integration of the linguistic server into library environments.

Wissenschaftliches Gebiet (EuroSciVoc)

CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.

Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen

Programm/Programme

Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.

Thema/Themen

Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.

Aufforderung zur Vorschlagseinreichung

Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.

Daten nicht verfügbar

Finanzierungsplan

Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.

Daten nicht verfügbar

Koordinator

CRIL Ingenierie
EU-Beitrag
Keine Daten
Adresse
174 rue de la République
92817 Puteaux
Frankreich

Auf der Karte ansehen

Gesamtkosten

Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.

Keine Daten

Beteiligte (5)

Mein Booklet 0 0