论文部分内容阅读
语音交流是最方便简单的通讯手段,但现实中的语音却会不可避免地受到环境噪声的影响。语音信号前端处理就是针对染噪语音信号所进行的包括端点检测和语音增强等有效手段。它的目的是尽可能地从输入染噪信号中提取有声语音段并改善其质量和可懂度,使人类易于接受。传统的技术多是基于线性系统理论,也取得了一定的效果,但对被强白噪声污染的语音信号的处理并不十分理想。近年来有研究表明语音信号是非线性过程,因此使用混沌方法会更加接近其物理本质;另外,发展很活跃的小波理论也将会在语音信号处理中占有越来越重要的地位。 本文将混沌与小波这两种非线性处理工具相结合,对加性白噪声下的语音信号前端处理做了较为仔细的讨论,包括两个主要内容:基于混沌方法的端点检测和基于小波变换的增强,其中前者是后者的基础。 (1)本文前半部分首先探讨了基于短时能频积的端点检测和基于短时傅里叶变换的谱减法去噪的不足;接着深入研究了语音信号的非线性特征,通过重构相空间,从关联维数和最大李亚普诺夫指数两个角度同时定量说明了语音信号是具有混沌性质的时间序列,因而可以用混沌手段对其进行处理;然后通过仿真发现语音信号和白噪声的伪最近邻点比例具有一定的差异,从而提出一种逐帧计算伪最近邻点比例并设定阈值进而判断有声段起止点的端点检测方法。 (2)本文后半部分针对语音信号自身的特点对传统一维小波去噪进行了适当地改进,并讨论了不同小波基函数和分解层数的选取对去噪结果的影响。使用混沌端点检测方法区分出有声段和无声段之后,选择Coiflet5小波基函数把语音信号进行5层小波分解,得到各层小波系数;把无声段的小波系数全部置为0,接着对有声段进行清浊音分割,根据它们不同的性质,对清音和浊音分别采取不同的阈值方案进行软阈值去噪;最后再把新的小波系数进行逆变换,重构得到增强后的语音信号。 结果表明,此前端处理方法能有效提高输出信噪比,改善了听觉效果,并且彻底克服了音乐噪声。