Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Contenu archivé le 2024-05-27
Getting Orientation in Complex Information Spaces as an Emergent Behaviour of Autonomous Information Agents

Article Category

Article available in the following languages:

Des taxinomies multilingues unifiées pour rendre efficace l'extraction d'informations dans une base de données

Dans le cadre du projet IRAIA, un institut bavarois a développé une méthode de pré-structuration de mots-clés pour permettre une intégration totale des différentes taxinomies.

Durant le 5ème PCRD (cinquième programme-cadre), le projet IRAIA a été mis en oeuvre afin que les technologies et les applications puissent entrer en adéquation avec les besoins du monde de demain. On entend par besoin la nécessité pour notre société d'informations d'améliorer et de développer la facilité d'utilisation, la fiabilité de fonctionnement, l'interopérabilité et l'accessibilité. Cet aspect du projet avait pour axe l'unification de la taxinomie des informations économiques, afin de créer un système d'extraction de base complet et varié. L'institut bavarois à l'origine de cette avancée et l'un des autres intervenants du projet IRAIA disposent tous deux d'instituts de recherche économique, raison pour laquelle a été choisi le domaine de l'économie. Etant donné que la compréhension de tout sujet nécessite une part importante d'expertise, le plus grand nombre possible de scénarios a été mis en oeuvre et testé. L'hypothèse de départ était que les structures de nombreux mots-clés confèrent à l'utilisateur une plus grande facilité de navigation et la capacité de gérer différentes langues. Ce dernier peut ainsi accéder au système et extraire les documents souhaités, à la fois dans le langage natal par défaut et dans toutes les autres langues du système. Ce projet a permis d'unifier deux taxinomies différentes par le développement de métadonnées et leur représentation parallèle dans différentes langues. Au tout début du développement, les structures du système s'appuyaient sur des structures économiques de type séries chronologiques. Dans la plupart des scénarios, ces structures disposaient d'un statut tridimensionnel composé d'un thème, d'une région et d'un secteur géographique, par exemple les ordinateurs, le secteur logiciel et la Grèce. Il existe d'autres possibilités d'évolution pour les structures de type séries chronologiques dans l'agriculture, les produits chimiques, les conférences, l'éducation, la fabrication, l'aérospatial, la construction, la liste étant illimitée. Les développeurs pensent que ce système doit, pour atteindre son potentiel maximal, être accompagné d'une plate-forme d'échange de métadonnées afin de télécharger en amont ou en aval les propositions de métadonnées. En outre, les développements initiaux jusqu'à présent effectués montrent que toute mise à niveau et toute étape ultérieure de génération peut commencer à un niveau avancé. En retour, ceci permettra au système d'atteindre plus facilement un niveau de couverture stratégique pour tous les types de structures industrielles en série.

Découvrir d’autres articles du même domaine d’application