高干扰环境下基于分布式光纤声波传感的微弱语音信号检测
TN912.3; 分布式光纤声波传感器(DAS)可用于隧道塌陷事故中的人员搜救、人声信号定位.但在基于DAS的语音活动检测(VAD)中,使用户外采集的真实数据进行语音提取面临着以下问题:受限于嘈杂的现场环境和有限的采集信号方式,收集到的语音易被复杂强噪声干扰,无法获得干净的语音数据用于监督训练.为了解决上述问题,本文提出一种基于短期自相关特征的算法(ST-ACF)进行语音活动检测,结合了音高信息和自相关函数检测语音帧的相关谐波特征,使得算法在极低信噪比(小于-10 dB)的DAS环境下仍能提取所有有效人声.ST-ACF算法包括预去噪阶段和语音检测阶段.在预去噪阶段,基于对语音音高信息周期性的研...
Saved in:
| Published in | 工程科学与技术 Vol. 57; no. 2; pp. 29 - 39 |
|---|---|
| Main Authors | , , , , , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
四川大学 视觉合成图形图像技术国家重点学科实验室,四川 成都 610065%四川德会高速公路有限责任公司,四川 凉山彝族自治州 615000
01.03.2025
四川大学 计算机学院,四川 成都 610065%四川大学 电气工程学院,四川 成都 610065%四川大学 计算机学院,四川 成都 610065 |
| Subjects | |
| Online Access | Get full text |
| ISSN | 2096-3246 |
| DOI | 10.12454/j.jsuese.202300803 |
Cover
| Summary: | TN912.3; 分布式光纤声波传感器(DAS)可用于隧道塌陷事故中的人员搜救、人声信号定位.但在基于DAS的语音活动检测(VAD)中,使用户外采集的真实数据进行语音提取面临着以下问题:受限于嘈杂的现场环境和有限的采集信号方式,收集到的语音易被复杂强噪声干扰,无法获得干净的语音数据用于监督训练.为了解决上述问题,本文提出一种基于短期自相关特征的算法(ST-ACF)进行语音活动检测,结合了音高信息和自相关函数检测语音帧的相关谐波特征,使得算法在极低信噪比(小于-10 dB)的DAS环境下仍能提取所有有效人声.ST-ACF算法包括预去噪阶段和语音检测阶段.在预去噪阶段,基于对语音音高信息周期性的研究,设计双通道时间窗口,对两类典型噪声进行预去噪.在语音检测阶段,提出一种改进式自相关函数,考虑特征值和变化幅度两个维度,通过其乘积最大化语音和噪音之间的距离,提高了算法对临界数据的处理能力.算法改进后能得到与特征出现频率匹配的最佳频谱窗口,可利用其寻找局部谐波,并通过分析局部谐波区分语音和非语音.实验使用DAS真实数据和NOISEX-92数据集中的6类噪声,采用指标误帧率对算法进行评估.结果表明,ST-ACF在高能噪声环境中表现优异,误帧率仅为19.74%,相较于基线算法提升了5.91%;同时,在DAS数据集上,ST-ACF也表现出最佳性能.总体而言,通过时间窗口和自相关函数的改进,ST-ACF在处理DAS语音数据时表现出色,对不同噪声环境都具有良好的检测性能,展现出应用于多种复杂场景的潜力,拓展了基于分布式光纤语音信号处理方向的研究. |
|---|---|
| ISSN: | 2096-3246 |
| DOI: | 10.12454/j.jsuese.202300803 |