Skip to main content
European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Domain Specific Systems for Information Extraction and Retrieval

Description du projet

Faciliter la récupération d’informations pour des textes propres à certains domaines

Internet abrite une incroyable quantité de données textuelles. De nombreuses méthodes d’extraction de textes actuelles échouent à produire des résultats satisfaisants face à un texte propre à un domaine, car elles ne peuvent pas comprendre le langage complexe spécifique à ce domaine. Financé au titre du programme Marie Skłodowska-Curie, le projet DoSSIER regroupe des experts, des universitaires et l’industrie pour faire la lumière sur la manière dont les utilisateurs comprennent, formulent et accèdent aux informations dans des environnements professionnels. Les résultats du projet serviront de base pour le développement d’une nouvelle génération de systèmes d’accès aux informations qui accéléreront l’innovation dans le milieu universitaire et industriel. Les questions actuellement sans réponse (par exemple, quelle est la principale différence en matière d’innovation entre ces deux brevets?) seront résolues soit directement par un système de récupération d’informations soit par des outils cognitifs.

Objectif

DoSSIER (Domain Specific Systems for Information Extraction and Retrieval) will elucidate, model, and address the different information needs of professional users. It mobilizes an excellent and highly synergistic team of world-leading Information Retrieval (IR) experts from 5 EU States who, together with 3 academic partners (universities in US, Japan, and Australia), and 11 industrial partners (dynamic SMEs and large corporations) will produce fundamental insights into how users comprehend, formulate, and access information in professional environments. For this, DoSSIER takes a highly innovative intersectorial and multidisciplinary approach, addresses fundamental questions about the nature and representation of information needs, engages in novel qualitative and quantitative evaluation, and provides training towards a structured, rigorous, and practical approach to search systems. It connects premier universities and outstanding industrial partners to provide unique opportunities to young researchers. The research is structured in three areas: 1. fundamental models of users and domain specificity, 2. contextual and personalized search, and 3. workflow, task and the interface. Each area individually and in cross-field fertilisation, will produce breakthroughs in our understanding of computer-supported human information search workflows. The result will be a new generation of information access systems, which will accelerate innovation cycles in EU academia and industry, as well as in society as a whole. To be both concrete and generic, DoSSIER consists of 8 projects identifying a target domain and 7 projects acting horizontally across domains. Three vital domains are used: science & technology innovation, law, and healthcare. Questions currently unanswerable (e.g. What is the key innovation difference between these two patents?) will be answerable either directly by a system, or by the development of cognition-enhancing instruments for interacting with information.

Champ scientifique

Coordinateur

TECHNISCHE UNIVERSITAET WIEN
Contribution nette de l'UE
€ 528 414,48
Adresse
KARLSPLATZ 13
1040 Wien
Autriche

Voir sur la carte

Région
Ostösterreich Wien Wien
Type d’activité
Higher or Secondary Education Establishments
Liens
Coût total
€ 528 414,48

Participants (7)