Des modules logiciels e-business aux petits soins pour les utilisateurs
Les bibliothèques, les archives judiciaires et les publications légales, médicales ou scientifique sont autant d'applications dans lesquelles les utilisateurs peuvent être contraints de trouver leur chemin parmi les nombreux documents disponibles en vue de retrouver une information particulière. Dans le cas d'applications e-business, la réponse consiste à classer et à organiser les documents selon une structure arborescente familière ou «taxonomie». La première étape consiste à extraire les informations des documents susceptibles d'être utilisés en vue de les organiser. Le projet a mis au point un module d'analyse de textes qui annote le document et génère une représentation de celui-ci en analysant le vocabulaire. Un module de catégorisation utilise ensuite les représentations du contenu des documents, ainsi que d'autres annotations et métadonnées, pour classer les documents selon une hiérarchie de type arborescence. Le module logiciel utilise un processus efficace pour prendre la décision correcte à chacun des points où une branche se sépare de la structure arborescente logique. Un troisième module, qui réutilise en grande partie le même code logiciel, établit le profil des utilisateurs afin d'offrir des services et fonctions personnalisés capables d'anticiper les besoins des utilisateurs. Ce système pourraient trouver des applications utiles dans des bibliothèques de référence, la recherche plein texte d'articles et de publications et l'accès à des documents publics proposés par des organisations administratives et de gestion du patrimoine.