Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Hybrid and Interpretable Deep neural audio machines

CORDIS oferuje możliwość skorzystania z odnośników do publicznie dostępnych publikacji i rezultatów projektów realizowanych w ramach programów ramowych HORYZONT.

Odnośniki do rezultatów i publikacji związanych z poszczególnymi projektami 7PR, a także odnośniki do niektórych konkretnych kategorii wyników, takich jak zbiory danych i oprogramowanie, są dynamicznie pobierane z systemu OpenAIRE .

Publikacje

Unsupervised Harmonic Parameter Estimation Using Differentiable DSP and Spectral Optimal Transport (odnośnik otworzy się w nowym oknie)

Autorzy: Torres, Bernardo; Peeters, Geoffroy; Richard, Gaël
Opublikowane w: IEEE International Conference on Acoustics, Speech, and Signal Processing, Apr 2024, Seoul, South Korea, 2024
Wydawca: IEEE
DOI: 10.48550/arxiv.2312.14507

GLA-GRAD: A Griffin-Lim Extended Waveform Generation Diffusion Model (odnośnik otworzy się w nowym oknie)

Autorzy: Haocheng Liu, Teysir Baoueb, Mathieu Fontaine, Jonathan Le Roux, Gaël Richard
Opublikowane w: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Numer 33, 2024
Wydawca: IEEE
DOI: 10.1109/ICASSP48485.2024.10446058

Learning Source Disentanglement in Neural Audio Codec

Autorzy: Xiaoyu Bie, Xubo Liu, Gaël Richard
Opublikowane w: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Wydawca: IEEE

Transfer Learning and Bias Correction with Pre-trained Audio Embeddings (odnośnik otworzy się w nowym oknie)

Autorzy: Wang, Changhong; Richard, Gaël; Mcfee, Brian
Opublikowane w: International Society for Music Information Retrieval Conference (ISMIR 2023), Nov. 2023, Milan, Italy, 2023
Wydawca: ISMIR
DOI: 10.5281/zenodo.10265222

A Fully Differentiable Model for Unsupervised Singing Voice Separation (odnośnik otworzy się w nowym oknie)

Autorzy: Richard, Gael; Chouteau, Pierre; Torres, Bernardo
Opublikowane w: IEEE International Conference on Acoustics, Speech, and Signal Processing, Apr 2024, Seoul, South Korea, 2024
Wydawca: IEEE
DOI: 10.48550/arxiv.2401.16837

Using Random codebooks for random neural autoencoders

Autorzy: Benoît Giniès, Xiaoyu Bie, Olivier Fercoq, Gaël Richard
Opublikowane w: European Signal Processing Conference (EUSIPCO), 2024
Wydawca: EURASIP

SpecDiff-GAN: A Spectrally-Shaped Noise Diffusion GAN for Speech and Music Synthesis (odnośnik otworzy się w nowym oknie)

Autorzy: Baoueb, Teysir; Liu, Haocheng; Fontaine, Mathieu; Le Roux, Jonathan; Richard, Gael
Opublikowane w: IEEE International Conference on Acoustics, Speech, and Signal Processing, Apr 2024, Seoul, South Korea, 2024
Wydawca: IEEE
DOI: 10.48550/arxiv.2402.01753

Speech dereverberation constrained on room impulse response characteristics.

Autorzy: Louis Bahrman, Mathieu Fontaine, Jonathan Le Roux, Gaël Richard
Opublikowane w: INTERSPEECH, 2024
Wydawca: ISCA

Investigating the Sensitivity of Pre-trained Audio Embeddings to Common Effects (odnośnik otworzy się w nowym oknie)

Autorzy: Victor Deng, Changhong Wang, Gaël Richard, Brian McFee
Opublikowane w: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Wydawca: IEEE
DOI: 10.48550/arXiv.2501.15900

F-StrIPE: Fast Structure-Informed Positional Encoding for Symbolic Music Generation (odnośnik otworzy się w nowym oknie)

Autorzy: Manvi Agarwal, Changhong Wang, Gaël Richard
Opublikowane w: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Wydawca: IEEE
DOI: 10.48550/arXiv.2502.10491

A Hybrid Model for Weakly-Supervised Speech Dereverberation

Autorzy: Louis Bahrman, Mathieu Fontaine, Gaël Richard
Opublikowane w: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Wydawca: IEEE

WaveTransfer: A Flexible End-to-end Multi-instrument Timbre Transfer with Diffusion

Autorzy: eysir Baoueb, Xiaoyu Bie, Hicham Janati, Gael Richard
Opublikowane w: IEEE International Workshop on Machine Learning for Signal Processing (MLSP 2024), 2024
Wydawca: IEEE

Singer Identity Representation Learning Using Self-Supervised Techniques (odnośnik otworzy się w nowym oknie)

Autorzy: Torres, Bernardo; Lattner, Stefan; Richard, Gael
Opublikowane w: International Society for Music Information Retrieval Conference (ISMIR 2023), Nov 2023, Milan, Italy, 2023
Wydawca: IEEE
DOI: 10.48550/arxiv.2401.05064

Structure-Informed Positional Encoding for Music Generation (odnośnik otworzy się w nowym oknie)

Autorzy: Manvi Agarwal, Changhong Wang, Gaël Richard
Opublikowane w: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Numer 2, 2024
Wydawca: IEEE
DOI: 10.1109/ICASSP48485.2024.10448149

Model-Based Deep Learning for Music Information Research (odnośnik otworzy się w nowym oknie)

Autorzy: Gaël Richard, Vincent Lostanlen, Yi-Hsuan Yang, Meinard Müller
Opublikowane w: IEEE Signal Processing Magazine, 2024, ISSN 1558-0792
Wydawca: IEEE
DOI: 10.1109/MSP.2024.3415569

Unsupervised Music Source Separation Using Differentiable Parametric Source Models (odnośnik otworzy się w nowym oknie)

Autorzy: Kilian Schulze-Forster; Gaël Richard; Liam Kelley; Clement S. J. Doire; Roland Badeau
Opublikowane w: IEEE/ACM Transactions on Audio, Speech and Language Processing, 2023, ISSN 2329-9290
Wydawca: IEEE
DOI: 10.1109/TASLP.2023.3252272

The HI-Audio Online platform for distributed music crowdsourcing database collection.

Autorzy: Jose Manuel Gil Panal, Aurélien David, Gaël Richard.
Opublikowane w: Late Breaking Demo – International Society for Music Information Retrieval Conference (ISMIR), 2023
Wydawca: ISMIR

Hi-Audio online platform: opportunities and challenges of collecting varied music data on the web

Autorzy: Jose Manuel Gil Panal, Aurelien David, Gaël Richard
Opublikowane w: Late breaking Demos - ISMIR 2024, 2024
Wydawca: ISMIR

"Dataset and Checkpoints for ""Structure-Informed Positional Encoding for Music Generation"""

Autorzy: Manvi Agarwal, Changhong Wang, Gaël Richard
Opublikowane w: Zenodo, 2024
Wydawca: Zenodo

Wyszukiwanie danych OpenAIRE...

Podczas wyszukiwania danych OpenAIRE wystąpił błąd

Brak wyników

Moja broszura 0 0