European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Article Category

Zawartość zarchiwizowana w dniu 2023-04-17

Article available in the following languages:

Jak stworzyć precyzyjne i wydajne metody zarządzania treściami audiowizualnymi

Zespół pewnej finansowanej przez UE inicjatywy pomaga nadawcom i realizatorom z sektora medialnego w efektywnym wykorzystywaniu szybko rozwijającej się technologii dużych zbiorów danych.

Gospodarka cyfrowa icon Gospodarka cyfrowa

Audiowizualne treści medialne nie tylko stanowią konieczne narzędzie do komunikacji i zapewniania rozrywki, ale są także postrzegane za przydatne źródła wiedzy na temat historii współczesnej. Jednak aby wszyscy mieli równy dostęp do tych cennych materiałów, należy przekształcić ruchome obrazy i dźwięki w słowa w sposób, który będzie wydajny i opłacalny. Taki właśnie cel przyświeca finansowanemu ze środków UE projektowi MeMAD, którego zespół pracuje nad automatycznymi, opartymi na języku metodami zarządzania, publikowania i uzyskiwania dostępu do już istniejących treści cyfrowych sektora kreatywnego. Skupiając się na telewizji i usługach na żądanie, zespół projektu chce ponadto wprowadzić ulepszenia w zakresie opowieści cyfrowych. Jak dowiadujemy się z artykułu opublikowanego na stronie projektu, w ponad dwa lata partnerzy projektu MeMAD opracowali prototyp platformy dla specjalistów w dziedzinie treści audiowizualnych, a następnie przeprowadzili jej kompleksową ocenę. „W naszej ocenie braliśmy pod uwagę następujące aspekty: wsparcie w zakresie montażu filmów, wyszukiwanie, tworzenie napisów dla osób niesłyszących z wykorzystaniem automatycznego rozpoznawania mowy oraz napisów obcojęzycznych za pomocą tłumaczenia maszynowego”. W tym samym artykule czytamy: „Po każdym zadaniu uczestnicy wypełniali formularze dotyczące doświadczeń użytkownika, które zostały dostosowane tak, aby skupiać się na konkretnym aspekcie, a nie na interfejsie użytkownika. Po każdej sesji przeprowadzano krótkie, częściowo ustrukturyzowane wywiady. Opinie na temat wsparcia w zakresie montażu filmu i wyszukiwania były ponadto zbierane na bieżąco”. W artykule napisano także, że tłumaczenie maszynowe oraz transkrypty powstałe z wykorzystaniem automatycznego rozpoznawania mowy okazały się szczególnie „przydatne zarówno w przypadku wsparcia w zakresie montażu filmu, jak i w przeszukiwaniu archiwum, chociaż oba te aspekty nadal wymagają dopracowania”. Jak podkreślają partnerzy projektu, prezentacja i wyszukiwanie metadanych także wymagają pewnych poprawek. „Szczególnie przydatna byłaby oparta na rozpoznawaniu twarzy i mowy opcja wyszukiwania fragmentów, w których dana osoba porusza dany temat. Musimy także przyjrzeć się samej długości fragmentów – w przypadku dłuższych filmów może się okazać, że narzędzie do montażu nie poradzi sobie z przetwarzaniem materiału podzielonego na liczne krótkie fragmenty”. Dalej czytamy: „W przyszłości oceniać będziemy także rozpoznawanie twarzy i przedmiotów. Jeśli będzie to możliwe, zaprosimy do współpracy tych samych uczestników, ponieważ już znają naszą platformę i są w stanie porównać rezultaty”.

Nowatorskie narzędzia

Uczenie i przetwarzanie maszynowe ułatwia uczestnikom projektu MeMAD (Methods for Managing Audiovisual Data: Combining Automatic Efficiency with Human Accuracy) zbieranie danych z dużych ilości treści, także tych w obcych językach. Celem zespołu jest także opracowanie nowatorskich narzędzi skierowanych do twórców treści, które umożliwiać będą lepsze zarządzanie treścią i automatyczną publikację zajawek na różnych platformach takich jak media społecznościowe. Dzięki wykorzystaniu tłumaczenia maszynowego do generowania transkryptów mowy i napisów zgromadzone treści będą dostępne także dla zagranicznych odbiorców oraz osób z wadami słuchu lub wzroku. W jednym z wielu przypadków zastosowania rozwiązań projektu MeMAD wykorzystano automatyczną transkrypcję, tłumaczenie maszynowe i automatyczne tworzenie napisów, dzięki czemu montaż wywiadów w obcym języku może odbywać się bez pomocy tłumacza. W innym przypadku automatycznie generowane opisy treści umożliwiają osobom niedowidzącym i niewidomym bycie na bieżąco z aktualnymi wydarzeniami. W okresowym sprawozdaniu z projektu na stronie serwisu CORDIS czytamy: „Kluczem do innowacji jest wprowadzanie jednolitej reprezentacji danych podstawowych, która zastąpi obecne procesy zorientowane na dokumenty bardziej usystematyzowanym podejściem, w efekcie ułatwiając produkcję w sektorze kreatywnym”. Więcej informacji: strona projektu MeMAD

Słowa kluczowe

MeMAD, audiowizualny, treści audiowizualne, montaż filmów, tłumaczenie maszynowe

Powiązane artykuły