Ziel
The first step in processing a text or corpus in any natural language is usually lexical tagging. It is probably the most basic and the most general-purpose operation in natural language processing. The quality and even the feasibility of further treatments depend on the quality of lexical analysis. The data and algorithms needed to achieve this task with a correct accuracy on unrestricted text include: forms or lemmata with a formal characterization of their morphological variations; the relevant lexical are morphological ones, i.e. homographs are represented in one lexical unit; characterization of their morphological variations; produce tags that encode their lexical category.
There is thus a strong need for electronic language resources and engineering standards in the morphology of European languages. The aim of GRAMLEX is to facilitate the initiation, coordination and standardisation of the construction of morphological dictionary packages for the essential part of several European languages, including detailed formal description of the morphology of the languages. The major challenges in such an enterprise are to give the description the largest possible coverage, in order to be able to process unrestricted text; to share as much as possible of the formats, methods and algorithms; and to improve time and space efficiency of programs.
Our approach is to tackle in parallel several aspects of the problem:
The contents, form and use of morphological lexical data. The form of lexical data will be examined and evaluated according to several criteria, including their use for generation and recognition and their interest for standardisation. The contents of dictionaries will be confronted with text corpora. The analysis of tokens not recognized will bring about feedback on that contents. In order to take account of the specific features of technical texts (e.g. in terminology, multilingual structuration of dictionaries is by nature easier than in general language), the terminology of telecommunications was chosen as an application field. The use of grammatical information for lexical disambiguation will be tested. A feedback on the grammatical contents of the tags is expected.
The four languages of the project, namely French, Hungarian, Italian and Polish, make up a benchmark for the coordination and standardization of methods and data in closely related, less closely related, and unrelated languages. The co-operation with the Hungarian partners will be a first tentative of comparing RELEX methods, initially devised for Indo-European languages, with methods used for a non Indo-European language with a very different morphological system.
The project will produce lexical resources designed for computer applications on unrestricted text, including technical texts. These resources will be available for research projects and other activities. By increasing their know-how and knowledge in lexical resources, the participants will promote the commercial interest of such resources.
Wissenschaftliches Gebiet (EuroSciVoc)
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.
CORDIS klassifiziert Projekte mit EuroSciVoc, einer mehrsprachigen Taxonomie der Wissenschaftsbereiche, durch einen halbautomatischen Prozess, der auf Verfahren der Verarbeitung natürlicher Sprache beruht. Siehe: Das European Science Vocabulary.
Dieses Projekt wurde noch nicht bei EuroSciVoc klassifiziert.
Schlagen Sie die Wissenschaftsbereiche vor, die Ihrer Einschätzung nach besonders relevant sind, und helfen Sie uns, unseren Klassifizierungsdienst zu verbessern.
Sie müssen sich anmelden oder registrieren, um diese Funktion zu nutzen
Programm/Programme
Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.
Mehrjährige Finanzierungsprogramme, in denen die Prioritäten der EU für Forschung und Innovation festgelegt sind.
Thema/Themen
Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.
Daten nicht verfügbar
Aufforderungen zur Einreichung von Vorschlägen sind nach Themen gegliedert. Ein Thema definiert einen bestimmten Bereich oder ein Gebiet, zu dem Vorschläge eingereicht werden können. Die Beschreibung eines Themas umfasst seinen spezifischen Umfang und die erwarteten Auswirkungen des finanzierten Projekts.
Aufforderung zur Vorschlagseinreichung
Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.
Daten nicht verfügbar
Verfahren zur Aufforderung zur Einreichung von Projektvorschlägen mit dem Ziel, eine EU-Finanzierung zu erhalten.
Finanzierungsplan
Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.
Finanzierungsregelung (oder „Art der Maßnahme“) innerhalb eines Programms mit gemeinsamen Merkmalen. Sieht folgendes vor: den Umfang der finanzierten Maßnahmen, den Erstattungssatz, spezifische Bewertungskriterien für die Finanzierung und die Verwendung vereinfachter Kostenformen wie Pauschalbeträge.
Koordinator
75251 Paris Cedex 5
Frankreich
Die Gesamtkosten, die dieser Organisation durch die Beteiligung am Projekt entstanden sind, einschließlich der direkten und indirekten Kosten. Dieser Betrag ist Teil des Gesamtbudgets des Projekts.