eStage marque une nouvelle étape dans l'extraction de données
Au sens figuré, les "araignées" du Web désignent ces outils qui passent Internet au crible pour trouver les données qu'on leur a demandé de chercher. Ces moteurs de balayage parcourent la multitude de serveurs dans lesquels les informations sont stockées et indexent les résultats trouvés. Ils présentent l'inconvénient d'indexer toutes les pages trouvées correspondant aux critères de recherche du mot-clé et ce quelle que soit l'importance des informations. En d'autres termes, ils ne disposent d'aucune structure hiérarchisant les liens conceptuels. Cependant, suivre ces liens prend souvent plus de temps que cela n'en vaut la peine, car l'utilisateur doit consulter toutes les pages pour trouver les données recherchées. Alors que de nombreux moteurs de recherche modernes disposent de fonctionnalités qui ont été, dans une certaine mesure, améliorées, la plupart continuent de fournir une multitude de références ayant très peu, voire aucun rapport avec le sujet concerné. Conçu par LemonLabs en Allemagne, eStage est un moteur de recherche différent. Les utilisateurs ne peuvent naviguer qu'en fonction des termes ou des phrases basés sur des concepts hiérarchiques pouvant être regroupés selon des catégories (productions, attributs et personnalités). Par exemple, la saisie du critère de recherche "lunettes" peut entraîner la création de concepts comme "fabrication de lunettes" ou "mode des lunettes" ou même "histoire des lunettes". Ce système particulier de renvoi des références employé par eStage a été baptisé "méthode de vote vectoriel". Lors de l'examen d'un document de texte par exemple, eStage compte le nombre de fois où un mot apparaît dans un document et élabore un index basé sur ces résultats. "Fabrication" par exemple peut apparaître une demi-douzaine de fois, rendant ce document plus adapté à une recherche basée sur le critère "fabrication de lunettes" que sur le critère "mode des lunettes". Regrouper les données de cette façon signifie que les informations sont triées selon des axes aisément reconnaissables, supprimant ainsi les ambiguïtés propres aux moteurs de recherche traditionnels. De plus, l'utilisateur ne perd jamais le contexte sémantique ou rencontre des données appartenant à un contexte totalement étranger. Alors que les moteurs de recherche traditionnels renvoient des centaines, si ce n'est des milliers de références, eStage présente seulement quelques documents sélectionnés avec précision qui correspondent mieux à l'information recherchée. Ceci facilite l'ensemble du processus d'extraction des données, puisqu'une requête génère une recherche également basée sur des concepts liés. Les moteurs de recherche traditionnels ont la capacité de vous faire accéder à tout le contenu Internet. eStage ne délivre que les informations pertinentes. Vous pouvez tester les nouvelles fonctions d'extraction de données et de recherche d'informations. Visitez le portal de l'information sur le monde de la marionnette en Europe (www.epuppetry.com) parfait exemple de l'application de la technologie eStage.