Cel
The first step in processing a text or corpus in any natural language is usually lexical tagging. It is probably the most basic and the most general-purpose operation in natural language processing. The quality and even the feasibility of further treatments depend on the quality of lexical analysis. The data and algorithms needed to achieve this task with a correct accuracy on unrestricted text include: forms or lemmata with a formal characterization of their morphological variations; the relevant lexical are morphological ones, i.e. homographs are represented in one lexical unit; characterization of their morphological variations; produce tags that encode their lexical category.
There is thus a strong need for electronic language resources and engineering standards in the morphology of European languages. The aim of GRAMLEX is to facilitate the initiation, coordination and standardisation of the construction of morphological dictionary packages for the essential part of several European languages, including detailed formal description of the morphology of the languages. The major challenges in such an enterprise are to give the description the largest possible coverage, in order to be able to process unrestricted text; to share as much as possible of the formats, methods and algorithms; and to improve time and space efficiency of programs.
Our approach is to tackle in parallel several aspects of the problem:
The contents, form and use of morphological lexical data. The form of lexical data will be examined and evaluated according to several criteria, including their use for generation and recognition and their interest for standardisation. The contents of dictionaries will be confronted with text corpora. The analysis of tokens not recognized will bring about feedback on that contents. In order to take account of the specific features of technical texts (e.g. in terminology, multilingual structuration of dictionaries is by nature easier than in general language), the terminology of telecommunications was chosen as an application field. The use of grammatical information for lexical disambiguation will be tested. A feedback on the grammatical contents of the tags is expected.
The four languages of the project, namely French, Hungarian, Italian and Polish, make up a benchmark for the coordination and standardization of methods and data in closely related, less closely related, and unrelated languages. The co-operation with the Hungarian partners will be a first tentative of comparing RELEX methods, initially devised for Indo-European languages, with methods used for a non Indo-European language with a very different morphological system.
The project will produce lexical resources designed for computer applications on unrestricted text, including technical texts. These resources will be available for research projects and other activities. By increasing their know-how and knowledge in lexical resources, the participants will promote the commercial interest of such resources.
Dziedzina nauki (EuroSciVoc)
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.
Projekt nie został jeszcze sklasyfikowany według klasyfikacji EuroSciVoc.
Wskaż dziedziny nauki, które twoim zdaniem są najbardziej istotne z punktu widzenia tego projektu i pomóż nam usprawnić naszą usługę klasyfikacji.
Aby użyć tej funkcji, musisz się zalogować lub zarejestrować
Program(-y)
Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.
Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.
Temat(-y)
Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.
Brak dostępnych danych
Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.
Zaproszenie do składania wniosków
Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.
Brak dostępnych danych
Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.
System finansowania
Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.
Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.
Koordynator
75251 Paris Cedex 5
Francja
Ogół kosztów poniesionych przez organizację w związku z uczestnictwem w projekcie. Obejmuje koszty bezpośrednie i pośrednie. Kwota stanowi część całkowitego budżetu projektu.