Description du projet
Faciliter la récupération d’informations pour des textes propres à certains domaines
Internet abrite une incroyable quantité de données textuelles. De nombreuses méthodes d’extraction de textes actuelles échouent à produire des résultats satisfaisants face à un texte propre à un domaine, car elles ne peuvent pas comprendre le langage complexe spécifique à ce domaine. Financé au titre du programme Marie Skłodowska-Curie, le projet DoSSIER regroupe des experts, des universitaires et l’industrie pour faire la lumière sur la manière dont les utilisateurs comprennent, formulent et accèdent aux informations dans des environnements professionnels. Les résultats du projet serviront de base pour le développement d’une nouvelle génération de systèmes d’accès aux informations qui accéléreront l’innovation dans le milieu universitaire et industriel. Les questions actuellement sans réponse (par exemple, quelle est la principale différence en matière d’innovation entre ces deux brevets?) seront résolues soit directement par un système de récupération d’informations soit par des outils cognitifs.
Objectif
DoSSIER (Domain Specific Systems for Information Extraction and Retrieval) will elucidate, model, and address the different information needs of professional users. It mobilizes an excellent and highly synergistic team of world-leading Information Retrieval (IR) experts from 5 EU States who, together with 3 academic partners (universities in US, Japan, and Australia), and 11 industrial partners (dynamic SMEs and large corporations) will produce fundamental insights into how users comprehend, formulate, and access information in professional environments. For this, DoSSIER takes a highly innovative intersectorial and multidisciplinary approach, addresses fundamental questions about the nature and representation of information needs, engages in novel qualitative and quantitative evaluation, and provides training towards a structured, rigorous, and practical approach to search systems. It connects premier universities and outstanding industrial partners to provide unique opportunities to young researchers. The research is structured in three areas: 1. fundamental models of users and domain specificity, 2. contextual and personalized search, and 3. workflow, task and the interface. Each area individually and in cross-field fertilisation, will produce breakthroughs in our understanding of computer-supported human information search workflows. The result will be a new generation of information access systems, which will accelerate innovation cycles in EU academia and industry, as well as in society as a whole. To be both concrete and generic, DoSSIER consists of 8 projects identifying a target domain and 7 projects acting horizontally across domains. Three vital domains are used: science & technology innovation, law, and healthcare. Questions currently unanswerable (e.g. What is the key innovation difference between these two patents?) will be answerable either directly by a system, or by the development of cognition-enhancing instruments for interacting with information.
Champ scientifique
Programme(s)
Régime de financement
MSCA-ITN - Marie Skłodowska-Curie Innovative Training Networks (ITN)Coordinateur
1040 Wien
Autriche