Cel
The project builds on and extends the results achieved in ACQUILEX by continuing research on theoretical issues in the design of lexicons and constructing further and more substantial monolingual and multilingual knowledge base fragments on the basis of a mixture of MRDs and manual encoding. At the same time, the project intends to make considerable use of corpora as a further source of data for the semi-automatic construction of lexical resources. Substantial quantities of textual and spoken-transcribed corpora are rapidly becoming available within the academic and dictionary publishing communities. Whilst MRDs provide a highly-structured and focused source of lexical data, substantial corpora can supplement this information with information concerning usage, frequency, and so forth. The proposed project will develop the software tools required to enable efficient use of corpora and will utilise them in the development of dictionary databases and the lexical knowledge base. In addition, we plan to tap the expertise of professional lexicographers and of the dictionary publishing industry far more directly in the new project in the investigation of theoretical issues and by transfering the tools, techniques and insights of computational lexicology and lexicography to that community.
The research concerns the acquisition of lexical knowledge for natural language processing systems, semiautomatically from machine readable versions of conventional dictionaries (MRDs) for English, Spanish, Italian and Dutch.
The project involves research on theoretical issues in the design of lexicons and constructing further and more substantial monolingual and multilingual knowledge base fragments on the basis of a mixture of MRDs and manual encoding.
A more sophisticated lexical representation language capable of dealing with more complex defeasible phenomena, such as blocking, has been developed and a formal semantics for this formalism specified. Corpus analysis tools have been developed for collocational analysis and lexical tagging. Further multilingual lexicon fragments exemplifying these developments are being constructed.
APPROACH AND METHODS
Work on ACQUILEX can be divided into two areas: the development of a methodology and the construction of software tools to create lexical databases from MRDs and the subsequent construction of illustrative theoretically-motivated, lexical knowledge base fragments from these databases, using a further set of software tools designed to integrate, enrich and formalise the database information. The emphasis of effort in ACQUILEX was on the development of lexical databases from MRDs and the design and implementation of a lexical representation language to underpin the lexical knowledge base. In this project, the emphasis is on the exploitation of these databases and the lexical knowledge base framework in the construction of more and more substantial lexicon fragments, and on the investigation of theoretical issues in lexicon design within the context of the unique research environment provided by the lexical databases and analysed corpora.
POTENTIAL
The project aims to foster productive collaboration between the computational linguistic and lexicographical community. We envisage that the proposed research and training activities will contribute to improvements in the quality of (particularly bi/multilingual and learners') dictionaries, to improvements in the productivity of the dictionary publishing industry and will provide impetus to electronic publishing initiatives, in addition to the central goal of producing a multilingual lexical knowledge base which can be deployed in habitable and practical natural language processing applications.
Dziedzina nauki (EuroSciVoc)
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.
- nauki przyrodnicze informatyka oprogramowanie
- nauki przyrodnicze informatyka bazy danych
- nauki przyrodnicze informatyka nauka o danych przetwarzanie języka naturalnego
- nauki społeczne ekonomia i biznes ekonomia ekonomia produkcji produktywność
Aby użyć tej funkcji, musisz się zalogować lub zarejestrować
Przepraszamy… podczas wykonywania operacji wystąpił nieoczekiwany błąd.
Wymagane uwierzytelnienie. Powodem może być wygaśnięcie sesji.
Dziękujemy za przesłanie opinii. Wkrótce otrzymasz wiadomość e-mail z potwierdzeniem zgłoszenia. W przypadku wybrania opcji otrzymywania powiadomień o statusie zgłoszenia, skontaktujemy się również gdy status ulegnie zmianie.
Program(-y)
Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.
Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.
Temat(-y)
Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.
Brak dostępnych danych
Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.
Zaproszenie do składania wniosków
Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.
Brak dostępnych danych
Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.
System finansowania
Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.
Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.
Brak dostępnych danych
Koordynator
CB2 1TN CAMBRIDGE
Zjednoczone Królestwo
Ogół kosztów poniesionych przez organizację w związku z uczestnictwem w projekcie. Obejmuje koszty bezpośrednie i pośrednie. Kwota stanowi część całkowitego budżetu projektu.