CORDIS
Wyniki badań wspieranych przez UE

CORDIS

Polski PL

Scalable Understanding of Multilingual Media

Informacje na temat projektu

Identyfikator umowy o grant: 688139

  • Data rozpoczęcia

    1 Lutego 2016

  • Data zakończenia

    31 Stycznia 2019

Finansowanie w ramach:

H2020-EU.2.1.1.

  • Całkowity budżet:

    € 7 963 951,25

  • Wkład UE

    € 6 193 361,25

Koordynowany przez:

THE UNIVERSITY OF EDINBURGH

Polski PL

Platforma monitorowania wiadomości ułatwia i przyspiesza pracę profesjonalistów w branży mediów

Błyskawiczny wzrost liczby kanałów telewizyjnych i internetowych źródeł informacji na całym świecie sprawił, że monitorowanie mediów stało się ogromnym wyzwaniem. Partnerzy pewnej unijnej inicjatywy podjęli to wyzwanie, opracowując platformę przetwarzającą olbrzymie ilości danych w wielu językach, dostępnych w wielu formatach.

Gospodarka cyfrowa
Społeczeństwo
© Rawpixel.com, Shutterstock

„Gwałtowny rozwój telewizji, radia, a także informacyjnych portali internetowych oraz innych tekstowych źródeł informacji sprawia, że istniejące rozwiązania i podejścia do monitorowania mediów nie wystarczą do skutecznego poradzenia sobie z zakresem tego wyzwania”, uważa prof. Steve Renals, koordynator finansowanego przez Unię Europejską projektu SUMMA. Monitorowanie mediów stanowi skomplikowany proces, wykorzystujący dane w wielu językach oraz wymagający automatycznego przetwarzania ogromnych ilości treści audio i wideo. Integracja zaawansowanych technologii mowy i języka Naukowcy skupieni wokół projektu SUMMA postanowili pomóc dziennikarzom i osobom zajmującym się monitorowaniem mediów, opracowując skalowalną, wielojęzyczną platformę monitorującą, która obejmuje narzędzia do przetwarzania mediów i technologie przetwarzania języka naturalnego. Zespół projektu SUMMA zaprojektował, opracował i wdrożył platformę, a następnie przetestował kilka prototypów we współpracy z dziennikarzami BBC i Deutsche Welle – dwóch spośród partnerów projektu. Jednym z kluczowych rozwiązań jest zaawansowany system rozpoznawania mowy i tłumaczenia maszynowego obsługujący szereg języków, w tym niemiecki, angielski, hiszpański, łotewski, portugalski, arabski, perski (farsi), rosyjski i ukraiński. Platforma umożliwia obecnie przetwarzanie wyłącznie tych języków, jednak pozwala także na obsługę niemal każdego spośród najważniejszych języków świata dzięki możliwości integracji z gotowymi narzędziami dostępnymi na rynku. Wykorzystywane w ramach platformy otwartoźródłowej narzędzia do przetwarzania mediów, w tym rozwiązanie do rozpoznawania mowy, automatycznej transkrypcji nagrań oraz wykonywania tłumaczeń maszynowych, pozwala na skalowanie i jednoczesne przetwarzanie setek strumieni audio i wideo, co pozwoli na zaspokojenie przyszłych potrzeb związanych ze stałym wzrostem liczby źródeł mediów. Platforma charakteryzuje się dużą elastycznością i możliwością dostosowania do zmieniających się potrzeb użytkowników, a także bezproblemową integracją nowych technologii. Monitorowanie wiadomości oraz wyszukiwanie gorących tematów stało się proste Platforma została wyposażona w szereg w pełni zautomatyzowanych rozwiązań monitorowania treści i umożliwia ich pobieranie przez interfejs programowania aplikacji (API). Po pobraniu filmu następuje automatyczna transkrypcja warstwy dźwiękowej i przetworzenie mowy na tekst. Jednocześnie przygotowywane jest również tłumaczenie całości tekstów – pobranych artykułów oraz przetranskrybowanych filmów – na język angielski. Skutkiem wykorzystania takich rozwiązań jest możliwość przygotowywania przeglądu treści, łączenia zgromadzonych powiązanych ze sobą elementów w historie, podsumowywania historii oraz poszczególnych elementów, dodawania słów kluczowych powiązanych z tematem, a także dodawania analizy nastrojów. Organizacja BBC wykorzystuje wyniki projektu SUMMA poprzez wdrożenie prototypowego silnika transkrypcji, dzięki któremu dziennikarze mogą wygodnie przeszukiwać treści zgromadzone przez BBC Monitoring. Brytyjski międzynarodowy nadawca publiczny korzysta również z systemu, który wykorzystuje platformę do informowania zespołów BBC World Service o publikowanych wiadomościach, które nadają się idealnie do tłumaczenia na inne języki. Z kolei Deutsche Welle wykorzystuje elementy rozwiązania SUMMA w ramach projektu Eurovox realizowanego przez Europejską Unię Nadawców, zajmującego się tworzeniem norm i standardów dotyczących automatycznego przetwarzania języka – tłumaczenia, transkrypcji, przygotowywania podpisów oraz wersji z lektorem – na potrzeby nadawania. W wyniku projektu SUMMA na rynku pojawiły się dwa nowe przedsiębiorstwa. Wykorzystując możliwości oferowane przez platformę, firma Mindflux opracowała kompleksowe rozwiązanie pozwalające na częściowo zautomatyzowaną lokalizację treści w celu tłumaczenia mediów w jakości produkcyjnej. Dzięki niemu użytkownicy otrzymają możliwość opracowywania transkrypcji, tłumaczeń oraz napisów do dowolnego filmu, pliku audio oraz tekstu w jednym miejscu, przy pomocy jednej platformy. Bazując na elementach platformy, firma Hatch AI opracowała z kolei rozwiązania oparte na sztucznej inteligencji i uczeniu maszynowym na potrzeby branży usług finansowych. „Dzięki platformie SUMMA gromadzenie, porządkowanie oraz analizowanie danych językowych jest prostsze niż kiedykolwiek wcześniej”, podsumowuje prof. Renals. „Profesjonaliści z branży mediów oraz serwisy informacyjne na całym świecie mogą dzięki niej po prostu filtrować treści, korzystając wyłącznie z potrzebnych informacji”.

Słowa kluczowe

SUMMA, media, treści, monitorowanie mediów, dziennikarze, platforma monitoringu, profesjonaliści z branży mediów, tłumaczenia maszynowe

Informacje na temat projektu

Identyfikator umowy o grant: 688139

  • Data rozpoczęcia

    1 Lutego 2016

  • Data zakończenia

    31 Stycznia 2019

Finansowanie w ramach:

H2020-EU.2.1.1.

  • Całkowity budżet:

    € 7 963 951,25

  • Wkład UE

    € 6 193 361,25

Koordynowany przez:

THE UNIVERSITY OF EDINBURGH