CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Automatic music transcription of polyphonic audio

Article Category

Article available in the following languages:

Aplikacja przetwarzająca dźwięk na notację muzyczną wstrząsnęła branżą muzyczną

Hybrydowa technologia inspirowana systemami typu „wirtualny asystent” oraz aplikacjami takimi jak Tłumacz Google jest już dostępna dla muzyków na całym świecie. Dzięki niej mogą oni z niezwykłą dokładnością przekształcać dźwięki na notację muzyczną.

Gospodarka cyfrowa icon Gospodarka cyfrowa

Dla laików, którzy chcą tylko cieszyć się muzyką podczas jazdy samochodem lub w domowym zaciszu, złożoność notacji muzycznej zawsze była odstraszająca. Notację nie tak łatwo odczytać, a jeszcze trudniej płynnie zapisać, zwłaszcza w przypadku dźwięków polifonicznych. Mimo to jest niezwykle istotna: wielu muzyków twierdzi, że znajomość notacji sprzyja tworzeniu lepszej muzyki. Dla tych muzyków rewolucyjnie proste w obsłudze rozwiązanie, przypominające Tłumacza Google, tylko dla notacji muzycznej, to spełnienie marzeń, co podkreśla prof. Sven Ahlbäck ze szwedzkiej firmy DoReMir Music Research AB. „Pomysły muzyczne, utwory czy melodie mogą pojawić się nagle i ważne jest, aby szybko zapisać to, co przyszło nam do głowy, zanim zniknie. Zapisywanie nut ręcznie lub na komputerze to powolny proces, którego właściwe opanowanie zajmuje dużo czasu i wymaga analizy składni muzycznej pod kątem metrum, tempa, rodzajów kluczy itd. Dla wielu muzyków możliwość szybkiego przejścia od pomysłu muzycznego do zapisu nutowego oznacza dużą oszczędność czasu”. Teraz nie muszą już dłużej szukać rozwiązania tego problemu: dzięki finansowaniu w ramach Instrumentu MŚP ScoreCloud, wirtualny asystent w postaci programu na komputer PC/Mac oraz aplikacji iOS, jest teraz dostępny do pobrania bezpłatnie lub na zasadzie miesięcznego abonamentu. ScoreCloud, przypominający aplikacje asystenckie Alexa firmy Amazon i Siri firmy Apple, posiada funkcję natychmiastowego tłumaczenia: wystarczy zaśpiewać lub zagrać na instrumencie, a aplikacja stworzy notację muzyczną, na bazie której można dalej rozwijać pomysł i w obrębie aplikacji tworzyć nowe aranżacje i kompozycje. Dodatkowo usługa sieciowa my.scorecloud pozwala udostępniać swoje zapisy nutowe innym muzykom z całego świata. „Od wielu lat badam postrzeganie form muzycznych przez człowieka. W tym czasie odkryłem, że moje wyniki mogą zostać wykorzystane do budowy programu komputerowego do automatycznego zapisywania nut” – wyjaśnia prof. Ahlbäck. „W ten sposób narodził się ScoreCloud – aplikacja, która ma pomóc muzykom, zarówno początkującym i amatorskim, jak i profesjonalnym, których utwory mają być wykonywane przez inne osoby lub którzy chcą dalej je rozwijać na podstawie zapisu nutowego”. Złożoność muzyki nie jest żadną przeszkodą. Jak twierdzi prof. Ahlbäck, zawarte w aplikacji ScoreCloud algorytmy modelowania poznawczego naśladują nasz sposób postrzegania muzyki i starają się generować nie tylko dokładną, ale i łatwą do odczytania notację muzyczną. Algorytmy te potrafią rozróżniać głosy przy śpiewie wielogłosowym i upraszczać partytury, tak samo jak człowiek zapisujący nuty ręcznie. Konieczność dostosowania aplikacji ScoreCloud, tak aby radziła sobie ze złożonością muzyki, sprawiła, że firma DoReMir zwróciła się o dofinansowanie ze strony UE. „Głównym problemem związanym z automatyczną notacją muzyczną była analiza dźwięków polifonicznych, w których jednocześnie rozbrzmiewa więcej niż jedna nuta. Jeszcze kilka lat temu poziom rozpoznawania tonów polimorficznych był daleki od ideału i nie wystarczał do tworzenia zapisów nutowych na podstawie dźwięków z instrumentów polimorficznych, takich jak fortepian czy gitara. Chcieliśmy sprawdzić, czy połączenie nowoczesnych technologii z algorytmami modelowania poznawczego pomoże pokonać trudności związane z automatyczną transkrypcją muzyki polifonicznej. Fundusze unijne dały nam taką szansę” – dodaje prof. Ahlbäck. Teraz śmiało można stwierdzić, że opracowany w ramach projektu DoReMIR (Automatic music transcription of polyphonic audio) system do transkrypcji tonów polimorficznych przekroczył wszelkie oczekiwania. Zdaniem prof. Ahlbäcka można nawet mówić o rekordzie w zakresie wydajności. „Osoby testujące wersję beta aplikacji ScoreCloud opisują ją jako »brakujące ogniwo« pomiędzy brzmieniem a notacją. Zwróciły się do nas również inne firmy programistyczne zainteresowane wykorzystaniem naszej technologii” – opowiada z entuzjazmem. Mimo że projekt został zakończony we wrześniu 2017 r., prof. Ahlbäck i jego zespół już pracują nad „produktami z długiej listy oczekujących”, w tym wieloplatformowymi aplikacjami dla śpiewaków, kompozytorów czy dzieci, które chcą dowiedzieć się więcej o muzyce. „Ta technologia pozwala analizować treści muzyczne na niespotykanym dotąd poziomie szczegółowości, co otwiera przed nami niesamowite możliwości w zakresie aplikacji do wyszukiwania treści muzycznych, systemów polecania muzyki itp. Obecnie właśnie wprowadzamy na rynek aplikację do wysyłania wiadomości muzycznych, która »umuzyczni« komunikację tekstową. Możliwości są nieograniczone” – podsumowuje prof. Ahlbäck.

Słowa kluczowe

DOREMIR, ScoreCloud, aplikacja, notacja muzyczna, Tłumacz Google, oprogramowanie, wirtualny asystent

Znajdź inne artykuły w tej samej dziedzinie zastosowania