电视剧语音识别中的半监督自动语音分割算法

TP918; 针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法.首先采用原始的标注文本构建一个有偏的语言模型, 然后将该语言模型以一种半监督的方式用于电视剧语音识别中, 最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进.在英国科幻电视剧"神秘博士"数据集合上的实验结果表明, 提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能, 不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题, 还能对相应的大段连续文本标注进行分段, 保证分割后各语音段时间标签及其对应文本的准确性....

Full description

Saved in:
Bibliographic Details
Published in数据采集与处理 Vol. 34; no. 2; pp. 281 - 287
Main Authors 龙艳花, 茅红伟, 叶宏
Format Journal Article
LanguageChinese
Published 上海师范大学信息与机电工程学院,上海,200234 01.03.2019
Subjects
Online AccessGet full text
ISSN1004-9037
DOI10.16337/j.1004-9037.2019.02.010

Cover

More Information
Summary:TP918; 针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法.首先采用原始的标注文本构建一个有偏的语言模型, 然后将该语言模型以一种半监督的方式用于电视剧语音识别中, 最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进.在英国科幻电视剧"神秘博士"数据集合上的实验结果表明, 提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能, 不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题, 还能对相应的大段连续文本标注进行分段, 保证分割后各语音段时间标签及其对应文本的准确性.
ISSN:1004-9037
DOI:10.16337/j.1004-9037.2019.02.010