Skip to main content
European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Article Category

Actualités
Contenu archivé le 2023-03-02

Article available in the following languages:

Un projet TSI pour améliorer la fourniture d'actualités en ligne

Des chercheurs travaillant sur un projet financé par l'UE ont développé une nouvelle série d'outils pour le web sémantique qui, affirment-ils, aideront les utilisateurs à trouver plus rapidement les nouvelles en ligne qui les intéressent le plus. La plate-forme de projet «Ne...

Des chercheurs travaillant sur un projet financé par l'UE ont développé une nouvelle série d'outils pour le web sémantique qui, affirment-ils, aideront les utilisateurs à trouver plus rapidement les nouvelles en ligne qui les intéressent le plus. La plate-forme de projet «News Engine Web Services» (NEWS) comprend un système de classification et d'annotation à base ontologique qui permet aux ordinateurs de «lire» le contenu des actualités en ligne dans de nombreuses langues et d'en analyser le contenu pour aboutir à une série de résultats correspondant au plus près aux besoins de l'utilisateur. L'utilisateur profane pourrait penser qu'un ordinateur effectue déjà ces tâches à l'heure actuelle lors d'une recherche en ligne. Ce n'est toutefois pas le cas: les pages web étant conçues pour être lues par des personnes et non par des machines, l'ordinateur ne peut rien sans notre intervention. Les technologies du web sémantique visent à changer tout cela en rendant les pages web compréhensibles pour les ordinateurs de sorte qu'ils puissent rechercher des sites web et exécuter des actions de façon standardisée. Le système d'annotation basé sur le web sémantique développé dans le cadre du projet NEWS permet aux agences de presse de mieux classifier l'information, d'où une personnalisation accrue de la fourniture d'actualités en ligne. «Jusqu'à présent, la classification des articles, dépêches et reportages s'effectuait sur la base d'une douzaine de termes, tels que sports, actualités internationales et finance, que les journalistes connaissaient par coeur», déclare M. Ansgar Bernardi, directeur adjoint du groupe de gestion des connaissances chez DFKI, le centre allemand de recherche sur l'intelligence artificielle, et coordinateur du projet NEWS. «Cela n'est pas très précis. Notre système peut automatiquement analyser un reportage et accéder à 1 300 termes de classification pour le définir», explique M. Bernardi. Une caractéristique du nouveau système de classification et d'annotation est sa capacité à faire la distinction entre les personnes ou les localités ayant la même dénomination afin d'éviter les «faux positifs». Pour cela, l'on utilise un algorithme adaptatif intitulé «IdentityRank». «Il s'agissait au départ d'un sous-produit de notre travail principal, mais il s'avère efficace et est susceptible, à mon avis, de générer un réel intérêt scientifique», poursuit M. Bernardi. En combinant leur système avec un programme de reconnaissance vocale déjà commercialisé, les partenaires du projet ont également développé une «preuve de concept» pour l'analyse de fichiers d'actualité audio. Le système mis au point dans le cadre du projet a suscité l'intérêt des agences de presse et sa commercialisation est actuellement à l'étude.