Search Results - "IEEE transactions on audio, speech, and language processing" :: K.UTB vyhledávací portál

Generating Human-Like Behaviors Using Joint, Speech-Driven Models for Conversational Agents

by Mariooryad, Soroosh, Busso, Carlos
Published in IEEE transactions on audio, speech, and language processing (01.10.2012)

Get full text

Journal Article

Loading…

Continuous F0 Modeling for HMM Based Statistical Parametric Speech Synthesis

by Kai Yu, Young, Steve
Published in IEEE transactions on audio, speech, and language processing (01.07.2011)

Get full text

Journal Article

Loading…

Identifying Cover Songs Using Information-Theoretic Measures of Similarity

by Foster, Peter, Dixon, Simon, Klapuri, Anssi
Published in IEEE/ACM transactions on audio, speech, and language processing (01.06.2015)

Get full text

Journal Article

Loading…

Semantic-Retention Attack for Continual Named Entity Recognition

by Yu, Yahan, Yang, Zhengdong, Cheng, Fei, Chu, Chenhui
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Exemplar-Based Sparse Representations for Noise Robust Automatic Speech Recognition

by Gemmeke, J. F., Virtanen, T., Hurmalainen, A.
Published in IEEE transactions on audio, speech, and language processing (01.09.2011)

Get full text

Journal Article

Loading…

Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers

by Chen, Sanyuan, Wang, Chengyi, Wu, Yu, Zhang, Ziqiang, Zhou, Long, Liu, Shujie, Chen, Zhuo, Liu, Yanqing, Wang, Huaming, Li, Jinyu, He, Lei, Zhao, Sheng, Wei, Furu
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Real-time speaker identification and verification

by Kinnunen, T., Karpov, E., Franti, P.
Published in IEEE transactions on audio, speech, and language processing (01.01.2006)

Get full text

Journal Article

Loading…

HAAQI-Net: A Non-Intrusive Neural Music Audio Quality Assessment Model for Hearing Aids

by Wisnu, Dyah A. M. G., Rini, Stefano, Zezario, Ryandhimas E., Wang, Hsin-Min, Tsao, Yu
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Explainable DNN-Based Beamformer With Postfilter

by Cohen, Adi, Wong, Daniel, Lee, Jung-Suk, Gannot, Sharon
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Joint Music Segmentation and Clustering Based on Self-Attentive Contrastive Learning of Multifaceted Self-Similarity Representation

by Chen, Tsung-Ping, Yoshii, Kazuyoshi
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

dYIN and dSWIPE: Differentiable Variants of Classical Fundamental Frequency Estimators

by Strahl, Sebastian, Muller, Meinard
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Zero-Shot Cross-Lingual Text-to-Speech With Style-Enhanced Normalization and Auditory Feedback Training Mechanism

by Tran, Chung, Luong, Chi Mai, Sakti, Sakriani
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Estimation of Physiological Vocal Features From Neck Surface Acceleration Signals Using Probabilistic Bayesian Neural Networks

by Sepulveda, Joaquin, Parra, Jesus A., Ibarra, Emiro J., Araya, Mauricio, Cuadra, Patricio De La, Zanartu, Matias
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

PMF-CEC: Phoneme-Augmented Multimodal Fusion for Context-Aware ASR Error Correction With Error-Specific Selective Decoding

by He, Jiajun, Toda, Tomoki
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Unsupervised Blind Joint Dereverberation and Room Acoustics Estimation With Diffusion Models

by Lemercier, Jean-Marie, Moliner, Eloi, Welker, Simon, Valimaki, Vesa, Gerkmann, Timo
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Open-Vocabulary Sound Event Localization and Detection With Joint Learning of CLAP Embedding and Activity-Coupled Cartesian DOA Vector

by Shimada, Kazuki, Uchida, Kengo, Koyama, Yuichiro, Shibuya, Takashi, Takahashi, Shusuke, Mitsufuji, Yuki, Kawahara, Tatsuya
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Fast Neural Vocoder With Fundamental Frequency Control Using Finite Impulse Response Filters

by Ohtani, Yamato, Okamoto, Takuma, Toda, Tomoki, Kawai, Hisashi
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Pretraining and Fine-Tuning Techniques for Electrolaryngeal Speech Enhancement Based on Sequence-to-Sequence Voice Conversion

by Ma, Ding, Violeta, Lester Phillip, Kobayashi, Kazuhiro, Toda, Tomoki
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Blind Localization of Early Room Reflections Based on Microphone Arrays and Reverberant Speech

by Hadadi, Yogev, Beit-On, Hanan, Tourbabin, Vladimir, Ben-Hur, Zamir, Alon, David Lou, Rafaely, Boaz
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Loading…

Noise and Reverberation-Controllable Voice Conversion

by Choi, Yeonjong, Xie, Chao, Toda, Tomoki
Published in IEEE Transactions on Audio, Speech and Language Processing (2025)

Get full text

Journal Article

Refine Results

Format

Subject Area

Topic

Language

Year of Publication

Database