Skip to main content

Article Category

Story

Article available in the folowing languages:

Najważniejsze wiadomości - Technologia wyszukiwania, pozwalająca gromadzić opinie oraz przewidywać przyszłość

Zespół europejskich naukowców zainspirowanych systemem katalogowania książek, zaprojektowanym ponad 50 lat temu przez hinduskiego bibliotekarza, stworzył nowy rodzaj internetowego systemu wyszukiwania, uwzględniający czynniki takie jak opinie, stronniczość, kontekst, czas oraz lokalizacja. Ta nowa technologia, która być może już niedługo pojawi się na rynku komercyjnym, pozwala śledzić trendy opinii publicznej dotyczące konkretnego tematu, firmy lub osoby na przestrzeni czasu. Co więcej, technologia ta pozwala nawet przewidywać przyszłość.

Gospodarka cyfrowa

"Jeśli wyszukacie Państwo słowo "klimat", korzystając z Google lub innego silnika wyszukiwania, to otrzymacie listę wyników, zawierających dane słowo: informacje te nie będą jednak przypisane do jakichkolwiek kategorii, ich porządek będzie losowy, a kontekst nie zostanie uwzględniony. Używane obecnie silniki wyszukiwania nie uwzględniają stopni zróżnicowania, tzn. czynników takich jak data opublikowania informacji, jej stronniczość, nieodzownie związana z treścią i strukturą, a także informacje o autorze", tłumaczy Fausto Giunchiglia, profesor informatyki na Uniwersytecie w Trento (Włochy). Czy jednak da się sprawić, by technologie wyszukiwania potrafiły identyfikować różnorodność i korzystać z niej? Czy silnik wyszukiwania może na przykład odpowiedzieć na pytanie jak zmieniały się opinie społeczne na temat zmian klimatycznych w ciągu ostatniej dekady? Lub też jak wysokie będą temperatury za sto lat, zakładając, że uwzględni się obecnie i przeszłe szacunki pochodzące z różnych źródeł? Wydaje się, że tak, dzięki pionierskiemu połączeniu współczesnej nauki oraz znanej od dziesięcioleci metody klasyfikowania. Powyższe podejście obrali europejscy naukowcy uczestniczący w projekcie LivingKnowledge (1). Dzięki wsparciu finansowemu w kwocie 4,8 milionów euro, zapewnionemu przez Komisję Europejską, zespół LivingKnowledge, koordynowany przez Prof. Giunchiglia, zastosował multi-dyscyplinarne podejście do opracowywania nowej technologii wyszukiwania, w którym wykorzystywane są elementy informatyki, socjologii, semiotyki oraz bibliotekoznawstwa. Źródło inspiracji dla uczestników projektu LivingKnowledge stanowiły prace Sirkali Ramamrita Ranganathana, hinduskiego bibliotekarza, zwanego ojcem współczesnego bibliotekoznawstwa. W latach 20-tych i 30-tych XX wieku Ranganathan stworzył pierwszy rozbudowany, analityczno-syntetyczny (wielo-aspektowy) system klasyfikacji. W systemie tym obiektom (książkom w przypadku Ranganathana oraz treściom internetowym i bazodanowym w przypadku zespołu LivingKnowledge) przypisuje się szereg cech charakterystycznych i atrybutów (aspektów), co pozwala je sortować na różne sposoby, zamiast nadawać im pojedynczy, predefiniowany porządek taksonomiczny. Używając powyższego systemu artykuł na temat wpływu rolnictwa na zmiany klimatyczne, napisany w Norwegii w 1990 roku, może być sklasyfikowany jako "Geografia; Klimat; Zmiany Klimatyczne; Rolnictwo; Badania; Norwegia; 1990." By lepiej zrozumieć system klasyfikacji oraz zastosować go w obrębie silników wyszukiwania, naukowcy uczestniczący w projekcie LivingKnowledge skontaktowali się z Indyjskim Instytutem Statystycznym - partnerem projektu, który na co dzień stosuje klasyfikację wielo-aspektową. "Dzięki posiadanej przez nich wiedzy mogliśmy przemienić pseudo-algorytm Ranganathana w algorytm komputerowy, który informatycy zastosowali do wyszukiwania informacji w Internecie, ekstrakcji ich znaczenia oraz kontekstu, w jakim się pojawiają, przypisywania do nich "aspektów", a następnie nadawania im struktury, w oparciu o stopnie zróżnicowania", twierdzi Prof. Giunchiglia. Naukowcy pracujący na Uniwersytecie w Pawii we Włoszech, który także był partnerem projektu LivingKnowledge, wykorzystali swą wiedzę i doświadczenie w zakresie nadawania znaczenia informacjom wyszukiwanym w Internecie (zarówno samym treściom tekstowym i multimedialnym, jak i sposobowi ich strukturyzacji i rozmieszczenia), w celu wyszukiwania informacji dotyczących stronniczości i opinii na dany temat, przypisując danym nowe aspekty. "Byliśmy w stanie zidentyfikować stronniczość autorów na dany temat, a także wyszukać opinie - zarówno pozytywne, jak i negatywne", twierdzi koordynator projektu LivingKnowledge. "Fakty pozostaną faktami, jednak informacjom na temat jakiegokolwiek wydarzenia, czy też tematu, często towarzyszą opinie i stronniczość". Od bibliotek z lat 30-tych XX wieku, po podróże kosmiczne w roku 2034... Powyższą technologię wdrożono w obrębie środowiska testowego, obecnie dostępnego jako oprogramowanie o otwartym kodzie źródłowym, wykorzystanego podczas testów z udziałem użytkowników. Testy te bazowały na dwóch ciekawych scenariuszach. Uczestnicy projektu, wspólnie z austriackim instytutem ds. badań socjologicznych o nazwie SORA, zastosowali system LivingKnowledge do wyszukiwania informacji na temat trendów oraz śledzenia reakcji opinii publicznej, zarówno w sposób ilościowy, jak i jakościowy. W kontekście analizy treści medialnych system LivingKnowledge mógłby pomóc przedsiębiorstwom badać skuteczność nowej kampanii marketingowej, dostarczając informacje na temat jej wpływu na rozpoznawalność marki na przestrzeni czasu, a także na temat najbardziej podatnych grup społecznych. Władze państwowe mogłyby dzięki powyższemu systemowi pozyskiwać informacje dotyczące reakcji opinii publicznej na wdrożenie nowej polityki, natomiast polityk mógłby dzięki systemowi LivingKnowledge w możliwie najlepszy sposób odpowiedzieć na wypowiedzi swego rywala. Uczestnicy projektu LivingKnowledge, wspólnie z fundacją badawczą typu non-profit o nazwie Barcelona Media, przy wsparciu firmy Yahoo! oraz we współpracy z holenderską Fundacją Pamięci Internetu ('Internet Memory Foundation') zbadali nie tylko przeszłe i obecne trendy, ale także ekstrapolowali je i stworzyli prognozy dotyczące przyszłości, oparte na istniejących danych. Opracowana przez powyższy zespół aplikacja o nazwie "Future Predictor" może wyszukiwać informacje na podstawie pytań takich jak "Jaka będzie cena ropy naftowej w roku 2050?", czy też "Jak bardzo wzrosną temperatury na świecie w ciągu najbliższych 100 lat?", odnajdując odpowiednie dane i prognozy dostępne obecnie w Internecie. Przykładowo, wynikiem wyszukiwania informacji na temat roku 2034 będą dane na temat "podróży kosmicznych", gdyż jest to najbardziej relewantny temat, zindeksowany w oparciu o dostępne obecnie wiadomości. "W kontekście bardziej współczesnym powyższy scenariusz aplikacyjny oferuje funkcjonalność pozwalającą wykrywać trendy zanim jeszcze staną się one oczywistym elementem codziennych wydarzeń. Wykrywanie to bazuje na zintegrowanych zdolnościach wyszukiwawczo-nawigacyjnych, pozwalających odnajdywać zróżnicowane, wielowymiarowe informacje, w oparciu o treść, stronniczość oraz czas", tłumaczy Prof. Giunchiglia. Kilku partnerów projektu planuje oferować powyższą technologię w postaci rozwiązań komercyjnych, natomiast koordynator projektu pragnie stworzyć fundację non-profit, która pozwoli wykorzystać wyniki projektu LivingKnowledge w momencie, gdy pojawi się większe prawdopodobieństwo zapotrzebowania na tego rodzaju technologię. Jak zauważa Prof. Giunchiglia, firma Google w sposób fundamentalny odmieniła świat oferując dostęp do większości informacji zgromadzonych na świecie, jednak informacje te dostępne są wyłącznie dla ludzi: obecnie wyłącznie istoty ludzkie potrafią zrozumieć znaczenie powyższych danych, czego efektem jest powszechny problem nadmiaru informacji ('information overload'). Wraz z wkraczaniem przez nas w epokę "dużych danych" ('big data'), informacje na temat dosłownie wszystkiego dostępne będą za kliknięciem guzika, co oznacza, że informacje te powinny być zrozumiałe nie tylko dla ludzi, ale także dla maszyn - niezbędne jest zatem połączenie ilości z jakością. Podejście obrane przez uczestników projektu LivingKnowledge pozwala stawić czoła powyższemu wyzwaniu. "Gdy rozpoczynaliśmy prace projektowe nikt nie mówił o "dużych danych". Obecnie wszyscy to robią, a technologie tego rodzaju spotykają się z coraz większym zainteresowaniem", twierdzi Prof. Giunchiglia. "W przyszłości "duże dane" będą wszechobecne - trudno powiedzieć, czy to dobrze, czy źle, z pewnością jednak czekają nas zmiany". Aplikacja "Future Predictor" nadaje dużą wiarygodność przewidywaniom profesora Giunchiglia. Projekt LivingKnowledge uzyskał wsparcie finansowe w ramach Siódmego Programu Ramowego UE (7PR). (1) "LivingKnowledge - fakty, opinie i stronniczość na przestrzeni czasu" ('LivingKnowledge facts, opinions and bias in time') Użyteczne odnośniki: - Strona internetowa projektu "LivingKnowledge - fakty, opinie i stronniczość na przestrzeni czasu" - 'LivingKnowledge facts, opinions and bias in time' - Informacje na temat projektu LivingKnowledge w bazie danych CORDIS