Objectif
This language technology project aims to bridge the gap from clausal syntax to text, and show how the syntactic mechanisms of the language indicate topical themes in text. The project will investigate a large number of texts using both human assessments of foreground and background statements and state-of-the art syntactic analysis tools to chart known and newly found systematic differences between how foreground and background themes are presented.
This language technology project aims to bridge the gap from clausal syntax to text, and show how the syntactic mechanisms of the language indicate topical themes in text. The project will investigate a large number of texts using both human assessments of foreground and background statements and state-of-the art syntactic analysis tools to chart known and newly found systematic differences between how foreground and background themes are presented.
OBJECTIVES
A bottleneck for improving today's information management systems is that we know little of texts as text. Systems view texts as simple sets of words or terms, discarding information such as clause style and argument structure as noise. This project aims to bridge the gap from syntax to text, and show how syntactic mechanisms of language, which primarily concern clause-internal structure, carry text-level information as well. Once we are able to chart some features of the topical progression in a text we will give a road map for algorithms for further processing: indexing and search, summarisation, report generation, and optical text recognition are all application areas which would benefit from better knowledge of what makes texts.
DESCRIPTION OF WORK
We will take a large number of texts in several languages and partition the clauses in them into a number of graded categories according to foregroundedness. These clause categories can then be used in different ways for indexing, multi-document summarization, and text item similarity calculation. This first assessment project takes the form of an experiment on text. If the experiment is successful, it opens up an entire research field, which we will continue examining in a future project.
1. Assemble corpus. If possible we will use the multilingual TREC corpus.
2. Define prototypical clause types based on our theory of foregroundedness.
3. Use human test subjects to partition clauses according to prototypical type.
4. Find and explain formal differences between types of clause as shown by test subjects, based on theory of transitivity.
5. Build tools to automatically identify clause types.
6. Index large number of texts using tools, and run test sets of information retrieval queries.
7. Result dissemination.
8. Plan for continued and refined experimentation.
Programme(s)
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Thème(s)
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Appel à propositions
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
Données non disponibles
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
Régime de financement
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Coordinateur
164 29 KISTA
Suède
Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.