一种基于互补声学模型的多系统融合语音关键词检测方法

TP391.4; 采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统的基础上,通过选择有效的系统融合准则,将多个系统的输出进行整合,获得更好的语音关键词检测结果.该方法充分利用了差异性声学建模系统之间的互补性,在不增加训练数据的情况下,显著地提升了最终系统的性能.和基线系统相比,该方法在2005年国家863电话语音关键词检测技术评测集上,存等错误率(Equal error rate,EER)指标下,获得相对21.6%的显著...

Full description

Saved in:
Bibliographic Details
Published in自动化学报 Vol. 35; no. 1; pp. 39 - 45
Main Authors 孟猛, 王晓瑞, 梁家恩, 徐波
Format Journal Article
LanguageChinese
Published 中国科学院自动化研究所数字内容技术研究中心,北京,100190%中国科学院自动化研究所数字内容技术研究中心,北京,100190 2009
中国科学院自动化研究所模式识别国家重点实验室,北京,100190
Subjects
Online AccessGet full text
ISSN0254-4156
DOI10.3724/SP.J.1004.2009.00039

Cover

More Information
Summary:TP391.4; 采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统的基础上,通过选择有效的系统融合准则,将多个系统的输出进行整合,获得更好的语音关键词检测结果.该方法充分利用了差异性声学建模系统之间的互补性,在不增加训练数据的情况下,显著地提升了最终系统的性能.和基线系统相比,该方法在2005年国家863电话语音关键词检测技术评测集上,存等错误率(Equal error rate,EER)指标下,获得相对21.6%的显著性能提升.
ISSN:0254-4156
DOI:10.3724/SP.J.1004.2009.00039