Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Hands-free Voice-enabled Interface to Web Applications for Smart Home Environments

CORDIS oferuje możliwość skorzystania z odnośników do publicznie dostępnych publikacji i rezultatów projektów realizowanych w ramach programów ramowych HORYZONT.

Odnośniki do rezultatów i publikacji związanych z poszczególnymi projektami 7PR, a także odnośniki do niektórych konkretnych kategorii wyników, takich jak zbiory danych i oprogramowanie, są dynamicznie pobierane z systemu OpenAIRE .

Rezultaty

Report on recognition evaluation, technologies, tools (odnośnik otworzy się w nowym oknie)

Report on the speech recognition engine evaluation results

User evaluation report (odnośnik otworzy się w nowym oknie)

Report on the overall system evaluation by users in an actual smart home environment

Report on the final WASN platform, evaluated using the ASR engine (odnośnik otworzy się w nowym oknie)

Final report on the wireless acoustic sensor network designed and implemented in LISTEN, including evaluation results based on the speech recognition engine

Dissemination package: workshops, publications, exhibitions, public outreach (odnośnik otworzy się w nowym oknie)

A report regarding all the dissemination activities of the project

Publikacje

Recent Improvements to Neural Network based Acoustic Modeling in the EML Transcription Platform

Autorzy: Volker Fischer
Opublikowane w: Proc. of DAGA 2016, 42 Jahrestagung für Akustik, 2016
Wydawca: DAGA

A Robust Voice Activity Detection for Real-Time Automatic Speech Recognition

Autorzy: O. Ghahabi, W. Zhou, V. Fischer
Opublikowane w: 2018
Wydawca: ESSV

LSTM, GRU, Highway and a Bit of Attention: An Empirical Overview for Language Modeling in Speech Recognition (odnośnik otworzy się w nowym oknie)

Autorzy: K. Irie, Z. Tüske, T. Alkhouli, R. Schlüter, and H. Ney
Opublikowane w: INTERSPEECH, Numer 2016, 2016, Strona(/y) 3519-3523
Wydawca: INTERSPEECH
DOI: 10.18154/rwth-conv-209197

Towards online-recognition with deep bidirectional LSTM acoustic models (odnośnik otworzy się w nowym oknie)

Autorzy: A. Zeyer, R. Schlüter, and H. Ney
Opublikowane w: INTERSPEECH, Numer 2016, 2016, Strona(/y) 3424-3428
Wydawca: INTERSPEECH
DOI: 10.18154/rwth-conv-211067

Comparison of BLSTM-Layer-Specific Affine Transformationsfor Speaker Adaptation (odnośnik otworzy się w nowym oknie)

Autorzy: M. Kitza, R. Schlüter, and H. Ney
Opublikowane w: Interspeech, Numer 2018, 2018, Strona(/y) 877-881
Wydawca: ISCA
DOI: 10.18154/rwth-conv-236793

The RWTH/UPB System Combination for the CHiME 2018 Workshop (odnośnik otworzy się w nowym oknie)

Autorzy: M. Kitza, W. Michel, C. Boeddeker, J. Heitkaemper, T. Menne, R. Schlüter, H. Ney, J. Schmalenstroeer, L. Drude, J. Heymann, R. Haeb-Umbach
Opublikowane w: The 5th International Workshop on Speech Processing in Everyday Environments (CHiME-5), Numer CHiME-5 (2018), 2018, Strona(/y) 53-57
Wydawca: ISCA (International Speech Communication Association)
DOI: 10.18154/rwth-conv-236789

Speaker Adapted Beamforming for Multi-Channel Automatic Speech Recognition (odnośnik otworzy się w nowym oknie)

Autorzy: Tobias Menne, Ralf Schluter, Hermann Ney
Opublikowane w: 2018 IEEE Spoken Language Technology Workshop (SLT), Numer 2018, 2018, Strona(/y) 535-541, ISBN 978-1-5386-4334-1
Wydawca: IEEE
DOI: 10.1109/slt.2018.8639547

Acoustic Modeling of Speech Waveform Based on Multi-Resolution, Neural Network Signal Processing (odnośnik otworzy się w nowym oknie)

Autorzy: Zoltan Tuske, Ralf Schluter, Hermann Ney
Opublikowane w: 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Numer 2018, 2018, Strona(/y) 4859-4863, ISBN 978-1-5386-4658-8
Wydawca: IEEE
DOI: 10.1109/icassp.2018.8461871

Segmental Encoder-Decoder Models for Large Vocabulary Automatic Speech Recognition (odnośnik otworzy się w nowym oknie)

Autorzy: Eugen Beck, Mirko Hannemann, Patrick Dötsch, Ralf Schlüter, Hermann Ney
Opublikowane w: Interspeech 2018, Numer 2018, 2018, Strona(/y) 766-770
Wydawca: ISCA
DOI: 10.21437/interspeech.2018-1212

Sequence Modeling and Alignment for LVCSR-Systems

Autorzy: E. Beck, A. Zeyer, P. Doetsch, A. Merboldt, R. Schlüter, and H. Ney
Opublikowane w: ITG Conference on Speech Communication (ITG), Numer 2018, 2018
Wydawca: VDE Verband der Elektrotechnik Elektronik Informationstechnik e.V.

Learning Acoustic Features from the Raw Waveform for Automatic Speech Recognition (odnośnik otworzy się w nowym oknie)

Autorzy: T. Menne, Z. Tüske, R. Schlüter, and H. Ney
Opublikowane w: 44. Jahrestagung für Akustik der Deutschen Gesellschaft für Akustik, Numer 2018, 2018, Strona(/y) 1533-1536
Wydawca: DAGA (Deutschen Gesellschaft für Akustik)
DOI: 10.18154/rwth-conv-236778

Spatially localized direction of arrival estimation (odnośnik otworzy się w nowym oknie)

Autorzy: Delikaris-Manias, Symeon; McCormack, Leo; Pavlidi, Despoina; Mouchtaris, Athanasios
Opublikowane w: Numer 1, 2018
Wydawca: EURONOISE
DOI: 10.5281/zenodo.3006164

Investigation into Joint Optimization of Single Channel Speech Enhancement and Acoustic Modeling for Robust ASR (odnośnik otworzy się w nowym oknie)

Autorzy: Menne, Tobias; Schlüter, Ralf; Ney, Hermann
Opublikowane w: ICASSP 2019<br/>ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), ICASSP, Brighton, UK, 2019-05-12 - 2019-05-17, Numer 1, 2019
Wydawca: IEEE
DOI: 10.18154/RWTH-2019-05286

ADAPTIVE MODELING OF SYNTHETIC NONSTATIONARY SINUSOIDS (odnośnik otworzy się w nowym oknie)

Autorzy: Caetano, Marcelo; Kafentzis, George; Mouchtaris, Athanasios
Opublikowane w: Numer 1, 2015
Wydawca: DAFX
DOI: 10.5281/zenodo.3006542

Normalization of Partly Overlapping Audio Recordings from the Same Event Based on Relative Signal Powers (odnośnik otworzy się w nowym oknie)

Autorzy: Nikolaos Stefanakis, Athanasios Mouchtaris
Opublikowane w: 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, Strona(/y) 3141-3145, ISBN 978-1-5386-4658-8
Wydawca: IEEE
DOI: 10.1109/ICASSP.2018.8461919

Prediction of LSTM-RNN Full Context States as a Subtask for N-gram Feedforward Language Models (odnośnik otworzy się w nowym oknie)

Autorzy: Irie, Kazuki; Lei, Zhihong; Schlüter, Ralf; Ney, Hermann
Opublikowane w: 2018 IEEE International Conference on Acoustics, Speech, and Signal Processing : proceedings : April 15-20, 2018, Calgary Telus Convention Center, Calgary, Alberta, Canada / sponsored by: the Institute of Electrical and Electronics Engineers, Signal Processing Society<br/>IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP, Calgary, Alberta, Canada, 2018-04-15 - 2018-, Numer 7, 2018
Wydawca: IEEE
DOI: 10.18154/RWTH-CONV-236772

Acoustic Beamforming in Front of a Reflective Plane (odnośnik otworzy się w nowym oknie)

Autorzy: Nikolaos Stefanakis, Symeon Delikaris-Manias, Athanasios Mouchtaris
Opublikowane w: 2018 26th European Signal Processing Conference (EUSIPCO), 2018, Strona(/y) 26-30, ISBN 978-9-0827-9701-5
Wydawca: IEEE
DOI: 10.23919/EUSIPCO.2018.8553103

3D DOA estimation of multiple sound sources based on spatially constrained beamforming driven by intensity vectors (odnośnik otworzy się w nowym oknie)

Autorzy: Despoina Pavlidi, Symeon Delikaris-Manias, Ville Pulkki, Athanasias Mouchtaris
Opublikowane w: 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2016, Strona(/y) 96-100, ISBN 978-1-4799-9988-0
Wydawca: IEEE
DOI: 10.1109/ICASSP.2016.7471644

Improving narrowband DOA estimation of sound sources using the complex Watson distribution (odnośnik otworzy się w nowym oknie)

Autorzy: Alexandridis, Anastasios; Mouchtaris, Athanasios
Opublikowane w: EUSIPCO 2016, 2016
Wydawca: EURASIP
DOI: 10.5281/zenodo.161845

Direction of Arrival Estimation in front of a Reflective Plane Using a Circular Microphone Array (odnośnik otworzy się w nowym oknie)

Autorzy: Stefanakis, N.; Mouchtaris, A.
Opublikowane w: EUSIPCO 2016, 2016
Wydawca: EURASIP
DOI: 10.5281/zenodo.161668

3D localization of multiple audio sources utilizing 2D DOA histograms (odnośnik otworzy się w nowym oknie)

Autorzy: Delikaris-Manias, Symeon; Pavlidi, Despoina; Pulkki, Ville; Mouchtaris, Athanasios
Opublikowane w: EUSIPCO 2016, 2016
Wydawca: EURASIP
DOI: 10.5281/zenodo.162131

Development and Evaluation of a Digital MEMS Microphone Array for Spatial Audio (odnośnik otworzy się w nowym oknie)

Autorzy: Alexandridis, Anastasios; Papadakis, Stefanos; Pavlidi, Despoina; Mouchtaris, Athanasios
Opublikowane w: EUSIPCO 2016, 2016
Wydawca: EURASIP
DOI: 10.5281/zenodo.161849

Multiple sound source location estimation and counting in a wireless acoustic sensor network View Document (odnośnik otworzy się w nowym oknie)

Autorzy: Alexandridis, Anastasios; Mouchtaris, Athanasios
Opublikowane w: WASPAA 2015, 2015
Wydawca: IEEE
DOI: 10.5281/zenodo.161840

DOA estimation with histogram analysis of spatially constrained active intensity vectors (odnośnik otworzy się w nowym oknie)

Autorzy: Symeon Delikaris-Manias, Despoina Pavlidi, Athanasios Mouchtaris, Ville Pulkki
Opublikowane w: 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, Strona(/y) 526-530, ISBN 978-1-5090-4117-6
Wydawca: IEEE
DOI: 10.1109/ICASSP.2017.7952211

Towards wireless acoustic sensor networks for location estimation and counting of multiple speakers in real-life conditions (odnośnik otworzy się w nowym oknie)

Autorzy: Anastasios Alexandridis, Nikolaos Stefanakis, Athanasios Mouchtaris
Opublikowane w: 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, Strona(/y) 6140-6144, ISBN 978-1-5090-4117-6
Wydawca: IEEE
DOI: 10.1109/ICASSP.2017.7953336

The RWTH/UPB/FORTH System Combination for the 4th CHiME Challenge Evaluation (odnośnik otworzy się w nowym oknie)

Autorzy: T. Menne, J. Heymann, A. Alexandridis, K. Irie, A. Zeyer, M. Kitza, P. Golik, L. Drude, R. Schlüter, H. Ney, R. Haeb-Umbach, A. Mouchtaris
Opublikowane w: CHiME Workshop, Numer CHiME-4 (2016), 2016, ISBN 978-2-9557814-0-1
Wydawca: Emmanuel Vincent
DOI: 10.18154/rwth-conv-211069

Multiple Sound Source Location Estimation in Wireless Acoustic Sensor Networks using DOA estimates: The Data-Association Problem (odnośnik otworzy się w nowym oknie)

Autorzy: Alexandridis, Anastasios; Mouchtaris, Athanasios
Opublikowane w: IEEE Transactions Audio, Speech, Language processing, Numer 1, 2018, ISSN 1558-7916
Wydawca: Institute of Electrical and Electronics Engineers
DOI: 10.5281/zenodo.1117766

Speech Analysis and Synthesis with a Computationally Efficient Adaptive Harmonic Model (odnośnik otworzy się w nowym oknie)

Autorzy: Morfi, Veronica; Degottex, Gilles; Mouchtaris, Athanasios
Opublikowane w: IEEE Transactions Audio, Speech, and Language Processing, Numer 1, 2015, ISSN 2329-9290
Wydawca: IEEE Advancing Technology for Humanity
DOI: 10.5281/zenodo.2593232

Perpendicular Cross-Spectra Fusion for Sound Source Localization With a Planar Microphone Array (odnośnik otworzy się w nowym oknie)

Autorzy: Nikolaos Stefanakis, Despoina Pavlidi, Athanasios Mouchtaris
Opublikowane w: IEEE/ACM Transactions on Audio, Speech, and Language Processing, Numer 25/9, 2017, Strona(/y) 1517-1531, ISSN 2329-9290
Wydawca: IEEE Advancing Technology for Humanity
DOI: 10.1109/TASLP.2017.2718733

Full-Band Quasi-Harmonic Analysis and Synthesis of Musical Instrument Sounds with Adaptive Sinusoids (odnośnik otworzy się w nowym oknie)

Autorzy: Marcelo Caetano, George Kafentzis, Athanasios Mouchtaris, Yannis Stylianou
Opublikowane w: Applied Sciences, Numer 6/5, 2016, Strona(/y) 127, ISSN 2076-3417
Wydawca: MDPI
DOI: 10.3390/app6050127

Wyszukiwanie danych OpenAIRE...

Podczas wyszukiwania danych OpenAIRE wystąpił błąd

Brak wyników

Moja broszura 0 0