噪声估计的语音增强算法

时间:2017-02-23 22:39:28 来源:论文投稿

1二值掩蔽

理想二值掩蔽[17]是为了保留混合信号中由目标语音主导的声音分量,并去除由噪声主导的声音分量,从而实现目标语音信号和噪声信号的分离。具体而言,首先将混合信号中的初步增强语音和估计噪声信号都分解为时频域二维表示形式,然后,计算每个时频单元,)的能量。在实际应用中,可利用式(10)计算估计的二值掩蔽。式中,,表示初步增强语音信号的能量,,表示估计噪声的能量,阈值示估计的信噪比,,、,和都用dB表示。如果时频单元内目标语音的能量大于噪声的能量,该时频单元被赋为‘1’,否则为‘0’。如图2,给出了采用式(10)得到含噪语音信号的估计二值掩蔽图,黑色表示时频单元为0,是需要掩蔽的部分,白色表示1,是需要保留的部分。从图中可以看出,白色部分很好的描述了目标语音的频谱轮廓,把噪声基本全部掩蔽掉,只保留目标语音信号。

2实验、结果和分析

选择6类噪声,分别为:white噪声,babble噪声,office噪声,factory噪声,street噪声和volvo噪声,实验中的含噪语音信号分别为-5dB、0dB和5dB。这些含噪语音信号分别采用本文提出的基于噪声估计的二值掩蔽的语音增强算法和文献[13]提出的基于MCRA噪声估计的语音增强算法进行语音去噪,实验结果如图3所示。图3为纯净语音信号受到street噪声污染使得输入信噪比为5dB时的处理效果,比较图(c)和图(d)可以看出,经过文献[13]算法处理后的语音依然残留部分背景噪声和一些“音乐噪声”;而经过本文算法处理后的语音基本没有残留背景噪声和“音乐噪声”,并且信噪比和可懂度的提高明显优于文献[13]提出的算法。为了评价本文算法的性能,本文采用ANSIS3.5-1997标准测试语音可懂度指数SpeechIntelli-gibilityIndex,SII)、ITU-TP.862标准测试语音主观语音质量评估(Perceptualevaluationofspeechquality,PESQ)和信噪比(SNR)进行测试。SII作为言语可懂度的客观标准,它的测试结果和主观可懂度测试有很大的相关性。其取值范围为(0,1),1表示可懂度最高,0表示可懂度指数最小;图4至图6分别给出了5dB、0dB和-5dB的含噪语音信号和两种方法进行语音增强后的SII指数,从图中可以得出,本文提出方法的SII指数提高量明显高于文献[13]提出的方法。

3结束语

本文结合了MCRA算法和二值掩蔽的优点,提出了一种基于噪声估计的二值掩蔽助听器语音增强算法,该算法利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理。MCRA算法对噪声估计相对比较准确,但通过过谱减算法后还是会残留部分背景噪声和“音乐噪声”,严重影响助听器的频响补偿效果。因此,结合了二值掩蔽的优点进一步对增强语音进行处理。结果表明,在平稳噪声和非平稳噪声环境下,本文提出的助听器语音增强算法能很好的去除残留的背景噪声和“音乐噪声”。此算法对助听器的后续频响补偿算法具有很大的意义,在助听器后续的频响补偿阶段,仅把有用的目标语音幅度放大,而没有把扰人的背景噪声放大,很大程度的提高了语音可懂度指数和信噪比,同时,在一定程度上提高了主观语音质量评估。

作者:曹龙涛 李如玮 鲍长春 吴水才 单位:北京工业大学 电子信息与控制工程学院 北京工业大学


更多科技论文论文详细信息: 噪声估计的语音增强算法 论文代写
http://m.400qikan.com/lw-189908 论文代发

相关专题:偷偷拿掉套子 许昌学院学报投稿

相关论文
相关学术期刊
《湘潭大学学报》 《领导文萃》 《成都体育学院学报》 《电气开关》 《大众汽车》 《中国文化研究》 《武警工程大学学报》 《兰州商学院学报》 《企业导报》 《微电子学》

< 返回首页