Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Hands-free Voice-enabled Interface to Web Applications for Smart Home Environments

CORDIS fournit des liens vers les livrables publics et les publications des projets HORIZON.

Les liens vers les livrables et les publications des projets du 7e PC, ainsi que les liens vers certains types de résultats spécifiques tels que les jeux de données et les logiciels, sont récupérés dynamiquement sur OpenAIRE .

Livrables

Report on recognition evaluation, technologies, tools (s’ouvre dans une nouvelle fenêtre)

Report on the speech recognition engine evaluation results

User evaluation report (s’ouvre dans une nouvelle fenêtre)

Report on the overall system evaluation by users in an actual smart home environment

Report on the final WASN platform, evaluated using the ASR engine (s’ouvre dans une nouvelle fenêtre)

Final report on the wireless acoustic sensor network designed and implemented in LISTEN, including evaluation results based on the speech recognition engine

Dissemination package: workshops, publications, exhibitions, public outreach (s’ouvre dans une nouvelle fenêtre)

A report regarding all the dissemination activities of the project

Publications

Recent Improvements to Neural Network based Acoustic Modeling in the EML Transcription Platform

Auteurs: Volker Fischer
Publié dans: Proc. of DAGA 2016, 42 Jahrestagung für Akustik, 2016
Éditeur: DAGA

A Robust Voice Activity Detection for Real-Time Automatic Speech Recognition

Auteurs: O. Ghahabi, W. Zhou, V. Fischer
Publié dans: 2018
Éditeur: ESSV

LSTM, GRU, Highway and a Bit of Attention: An Empirical Overview for Language Modeling in Speech Recognition (s’ouvre dans une nouvelle fenêtre)

Auteurs: K. Irie, Z. Tüske, T. Alkhouli, R. Schlüter, and H. Ney
Publié dans: INTERSPEECH, Numéro 2016, 2016, Page(s) 3519-3523
Éditeur: INTERSPEECH
DOI: 10.18154/rwth-conv-209197

Towards online-recognition with deep bidirectional LSTM acoustic models (s’ouvre dans une nouvelle fenêtre)

Auteurs: A. Zeyer, R. Schlüter, and H. Ney
Publié dans: INTERSPEECH, Numéro 2016, 2016, Page(s) 3424-3428
Éditeur: INTERSPEECH
DOI: 10.18154/rwth-conv-211067

Comparison of BLSTM-Layer-Specific Affine Transformationsfor Speaker Adaptation (s’ouvre dans une nouvelle fenêtre)

Auteurs: M. Kitza, R. Schlüter, and H. Ney
Publié dans: Interspeech, Numéro 2018, 2018, Page(s) 877-881
Éditeur: ISCA
DOI: 10.18154/rwth-conv-236793

The RWTH/UPB System Combination for the CHiME 2018 Workshop (s’ouvre dans une nouvelle fenêtre)

Auteurs: M. Kitza, W. Michel, C. Boeddeker, J. Heitkaemper, T. Menne, R. Schlüter, H. Ney, J. Schmalenstroeer, L. Drude, J. Heymann, R. Haeb-Umbach
Publié dans: The 5th International Workshop on Speech Processing in Everyday Environments (CHiME-5), Numéro CHiME-5 (2018), 2018, Page(s) 53-57
Éditeur: ISCA (International Speech Communication Association)
DOI: 10.18154/rwth-conv-236789

Speaker Adapted Beamforming for Multi-Channel Automatic Speech Recognition (s’ouvre dans une nouvelle fenêtre)

Auteurs: Tobias Menne, Ralf Schluter, Hermann Ney
Publié dans: 2018 IEEE Spoken Language Technology Workshop (SLT), Numéro 2018, 2018, Page(s) 535-541, ISBN 978-1-5386-4334-1
Éditeur: IEEE
DOI: 10.1109/slt.2018.8639547

Acoustic Modeling of Speech Waveform Based on Multi-Resolution, Neural Network Signal Processing (s’ouvre dans une nouvelle fenêtre)

Auteurs: Zoltan Tuske, Ralf Schluter, Hermann Ney
Publié dans: 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Numéro 2018, 2018, Page(s) 4859-4863, ISBN 978-1-5386-4658-8
Éditeur: IEEE
DOI: 10.1109/icassp.2018.8461871

Segmental Encoder-Decoder Models for Large Vocabulary Automatic Speech Recognition (s’ouvre dans une nouvelle fenêtre)

Auteurs: Eugen Beck, Mirko Hannemann, Patrick Dötsch, Ralf Schlüter, Hermann Ney
Publié dans: Interspeech 2018, Numéro 2018, 2018, Page(s) 766-770
Éditeur: ISCA
DOI: 10.21437/interspeech.2018-1212

Sequence Modeling and Alignment for LVCSR-Systems

Auteurs: E. Beck, A. Zeyer, P. Doetsch, A. Merboldt, R. Schlüter, and H. Ney
Publié dans: ITG Conference on Speech Communication (ITG), Numéro 2018, 2018
Éditeur: VDE Verband der Elektrotechnik Elektronik Informationstechnik e.V.

Learning Acoustic Features from the Raw Waveform for Automatic Speech Recognition (s’ouvre dans une nouvelle fenêtre)

Auteurs: T. Menne, Z. Tüske, R. Schlüter, and H. Ney
Publié dans: 44. Jahrestagung für Akustik der Deutschen Gesellschaft für Akustik, Numéro 2018, 2018, Page(s) 1533-1536
Éditeur: DAGA (Deutschen Gesellschaft für Akustik)
DOI: 10.18154/rwth-conv-236778

Spatially localized direction of arrival estimation (s’ouvre dans une nouvelle fenêtre)

Auteurs: Delikaris-Manias, Symeon; McCormack, Leo; Pavlidi, Despoina; Mouchtaris, Athanasios
Publié dans: Numéro 1, 2018
Éditeur: EURONOISE
DOI: 10.5281/zenodo.3006164

Investigation into Joint Optimization of Single Channel Speech Enhancement and Acoustic Modeling for Robust ASR (s’ouvre dans une nouvelle fenêtre)

Auteurs: Menne, Tobias; Schlüter, Ralf; Ney, Hermann
Publié dans: ICASSP 2019<br/>ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), ICASSP, Brighton, UK, 2019-05-12 - 2019-05-17, Numéro 1, 2019
Éditeur: IEEE
DOI: 10.18154/RWTH-2019-05286

ADAPTIVE MODELING OF SYNTHETIC NONSTATIONARY SINUSOIDS (s’ouvre dans une nouvelle fenêtre)

Auteurs: Caetano, Marcelo; Kafentzis, George; Mouchtaris, Athanasios
Publié dans: Numéro 1, 2015
Éditeur: DAFX
DOI: 10.5281/zenodo.3006542

Normalization of Partly Overlapping Audio Recordings from the Same Event Based on Relative Signal Powers (s’ouvre dans une nouvelle fenêtre)

Auteurs: Nikolaos Stefanakis, Athanasios Mouchtaris
Publié dans: 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2018, Page(s) 3141-3145, ISBN 978-1-5386-4658-8
Éditeur: IEEE
DOI: 10.1109/ICASSP.2018.8461919

Prediction of LSTM-RNN Full Context States as a Subtask for N-gram Feedforward Language Models (s’ouvre dans une nouvelle fenêtre)

Auteurs: Irie, Kazuki; Lei, Zhihong; Schlüter, Ralf; Ney, Hermann
Publié dans: 2018 IEEE International Conference on Acoustics, Speech, and Signal Processing : proceedings : April 15-20, 2018, Calgary Telus Convention Center, Calgary, Alberta, Canada / sponsored by: the Institute of Electrical and Electronics Engineers, Signal Processing Society<br/>IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP, Calgary, Alberta, Canada, 2018-04-15 - 2018-, Numéro 7, 2018
Éditeur: IEEE
DOI: 10.18154/RWTH-CONV-236772

Acoustic Beamforming in Front of a Reflective Plane (s’ouvre dans une nouvelle fenêtre)

Auteurs: Nikolaos Stefanakis, Symeon Delikaris-Manias, Athanasios Mouchtaris
Publié dans: 2018 26th European Signal Processing Conference (EUSIPCO), 2018, Page(s) 26-30, ISBN 978-9-0827-9701-5
Éditeur: IEEE
DOI: 10.23919/EUSIPCO.2018.8553103

3D DOA estimation of multiple sound sources based on spatially constrained beamforming driven by intensity vectors (s’ouvre dans une nouvelle fenêtre)

Auteurs: Despoina Pavlidi, Symeon Delikaris-Manias, Ville Pulkki, Athanasias Mouchtaris
Publié dans: 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2016, Page(s) 96-100, ISBN 978-1-4799-9988-0
Éditeur: IEEE
DOI: 10.1109/ICASSP.2016.7471644

Improving narrowband DOA estimation of sound sources using the complex Watson distribution (s’ouvre dans une nouvelle fenêtre)

Auteurs: Alexandridis, Anastasios; Mouchtaris, Athanasios
Publié dans: EUSIPCO 2016, 2016
Éditeur: EURASIP
DOI: 10.5281/zenodo.161845

Direction of Arrival Estimation in front of a Reflective Plane Using a Circular Microphone Array (s’ouvre dans une nouvelle fenêtre)

Auteurs: Stefanakis, N.; Mouchtaris, A.
Publié dans: EUSIPCO 2016, 2016
Éditeur: EURASIP
DOI: 10.5281/zenodo.161668

3D localization of multiple audio sources utilizing 2D DOA histograms (s’ouvre dans une nouvelle fenêtre)

Auteurs: Delikaris-Manias, Symeon; Pavlidi, Despoina; Pulkki, Ville; Mouchtaris, Athanasios
Publié dans: EUSIPCO 2016, 2016
Éditeur: EURASIP
DOI: 10.5281/zenodo.162131

Development and Evaluation of a Digital MEMS Microphone Array for Spatial Audio (s’ouvre dans une nouvelle fenêtre)

Auteurs: Alexandridis, Anastasios; Papadakis, Stefanos; Pavlidi, Despoina; Mouchtaris, Athanasios
Publié dans: EUSIPCO 2016, 2016
Éditeur: EURASIP
DOI: 10.5281/zenodo.161849

Multiple sound source location estimation and counting in a wireless acoustic sensor network View Document (s’ouvre dans une nouvelle fenêtre)

Auteurs: Alexandridis, Anastasios; Mouchtaris, Athanasios
Publié dans: WASPAA 2015, 2015
Éditeur: IEEE
DOI: 10.5281/zenodo.161840

DOA estimation with histogram analysis of spatially constrained active intensity vectors (s’ouvre dans une nouvelle fenêtre)

Auteurs: Symeon Delikaris-Manias, Despoina Pavlidi, Athanasios Mouchtaris, Ville Pulkki
Publié dans: 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, Page(s) 526-530, ISBN 978-1-5090-4117-6
Éditeur: IEEE
DOI: 10.1109/ICASSP.2017.7952211

Towards wireless acoustic sensor networks for location estimation and counting of multiple speakers in real-life conditions (s’ouvre dans une nouvelle fenêtre)

Auteurs: Anastasios Alexandridis, Nikolaos Stefanakis, Athanasios Mouchtaris
Publié dans: 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2017, Page(s) 6140-6144, ISBN 978-1-5090-4117-6
Éditeur: IEEE
DOI: 10.1109/ICASSP.2017.7953336

The RWTH/UPB/FORTH System Combination for the 4th CHiME Challenge Evaluation (s’ouvre dans une nouvelle fenêtre)

Auteurs: T. Menne, J. Heymann, A. Alexandridis, K. Irie, A. Zeyer, M. Kitza, P. Golik, L. Drude, R. Schlüter, H. Ney, R. Haeb-Umbach, A. Mouchtaris
Publié dans: CHiME Workshop, Numéro CHiME-4 (2016), 2016, ISBN 978-2-9557814-0-1
Éditeur: Emmanuel Vincent
DOI: 10.18154/rwth-conv-211069

Multiple Sound Source Location Estimation in Wireless Acoustic Sensor Networks using DOA estimates: The Data-Association Problem (s’ouvre dans une nouvelle fenêtre)

Auteurs: Alexandridis, Anastasios; Mouchtaris, Athanasios
Publié dans: IEEE Transactions Audio, Speech, Language processing, Numéro 1, 2018, ISSN 1558-7916
Éditeur: Institute of Electrical and Electronics Engineers
DOI: 10.5281/zenodo.1117766

Speech Analysis and Synthesis with a Computationally Efficient Adaptive Harmonic Model (s’ouvre dans une nouvelle fenêtre)

Auteurs: Morfi, Veronica; Degottex, Gilles; Mouchtaris, Athanasios
Publié dans: IEEE Transactions Audio, Speech, and Language Processing, Numéro 1, 2015, ISSN 2329-9290
Éditeur: IEEE Advancing Technology for Humanity
DOI: 10.5281/zenodo.2593232

Perpendicular Cross-Spectra Fusion for Sound Source Localization With a Planar Microphone Array (s’ouvre dans une nouvelle fenêtre)

Auteurs: Nikolaos Stefanakis, Despoina Pavlidi, Athanasios Mouchtaris
Publié dans: IEEE/ACM Transactions on Audio, Speech, and Language Processing, Numéro 25/9, 2017, Page(s) 1517-1531, ISSN 2329-9290
Éditeur: IEEE Advancing Technology for Humanity
DOI: 10.1109/TASLP.2017.2718733

Full-Band Quasi-Harmonic Analysis and Synthesis of Musical Instrument Sounds with Adaptive Sinusoids (s’ouvre dans une nouvelle fenêtre)

Auteurs: Marcelo Caetano, George Kafentzis, Athanasios Mouchtaris, Yannis Stylianou
Publié dans: Applied Sciences, Numéro 6/5, 2016, Page(s) 127, ISSN 2076-3417
Éditeur: MDPI
DOI: 10.3390/app6050127

Recherche de données OpenAIRE...

Une erreur s’est produite lors de la recherche de données OpenAIRE

Aucun résultat disponible

Mon livret 0 0