Projekt IST ma usprawnić dostarczanie wiadomości przez Internet
Badacze pracujący nad projektem finansowanym przez UE opracowali nowy zestaw narzędzi sieci semantycznej, które, jak twierdzą, pomogą użytkownikom szybciej wyszukiwać w Internecie wiadomości, które ich najbardziej interesują. Platforma projektu NEWS (News Engine Web Services - serwisy internetowe z silnikiem wiadomości) obejmuje system adnotacji bazujący na kategoriach i ontologii, umożliwiający komputerom "odczytywanie" zawartości stron internetowych z wiadomościami w różnych językach i analizowanie treści, a następnie dostarczanie zestawu wyników, które najlepiej odpowiadają potrzebom danego użytkownika. Nieświadomy użytkownik może uważać, że właśnie tak postępuje obecnie komputer, gdy wyszukujemy informacje w Internecie. Jednak komputer nie może wykonać tych zadań bez naszej interwencji, ponieważ strony internetowe są zaprojektowane do czytania przez ludzi, a nie maszyny. Technologie sieci semantycznych mają na celu zmianę tej sytuacji przez uczynienie stron internetowych zrozumiałymi dla komputerów, tak aby mogły one przeszukiwać serwisy internetowe i działać w sposób znormalizowany. Semantyczny internetowy system adnotacji opracowany w ramach projektu NEWS pozwala agencjom informacyjnym na lepszą klasyfikację informacji, czego rezultatem jest bardziej zindywidualizowane dostarczanie wiadomości przez Internet. - Dotychczas kategorie wiadomości zazwyczaj składały się z około 12 określeń, takich jak sport, wiadomości ze świata, finanse, które dziennikarze znali na pamięć - mówi dr Angsar Bernardi, zastępca szefa grupy zarządzającej wiedzą w DFKI - Niemieckim Centrum Badań nad Sztuczną Inteligencją oraz koordynator projektu NEWS. - Nie jest to bardzo dokładne. Nasz system może automatycznie analizować daną pozycję wiadomości i korzystać z 1300 terminów klasyfikacyjnych, aby ją zdefiniować - mówi dr Bernardi. Cechą nowego systemu klasyfikacji i adnotacji jest jego umiejętność różnicowania pomiędzy ludźmi i miejscami reprezentowanymi przez taką samą nazwę, aby uniknąć "fałszywych trafień". Osiągnięto to dzięki wykorzystaniu adaptacyjnego algorytmu o nazwie "IdentityRank". - Początkowo był to właściwie produkt uboczny naszej głównej pracy, lecz działa dobrze i myślę, że może wywołać nawet dość duże zainteresowanie naukowe - mówi dr Bernardi. Poprzez połączenie swego systemu z istniejącym komercyjnym programem identyfikacji głosu partnerzy projektu opracowali również narzędzie "weryfikacji koncepcji" do analizy plików audio z wiadomościami. Uzyskany w ramach projektu system wzbudził pewne zainteresowanie agencji informacyjnych i przygotowywany jest już plan komercjalizacji.