非平稳噪声环境中的语音增强技术研究

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:xxzjlei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
日常生活中,语音使得人与人之间的交流变得高效。但是,噪声往往会对语音信号造成干扰,降低语音的质量,影响人们之间的交流。通常,噪声具有的不同特性和随机性使得完全消除噪声是不可能的,尤其在非平稳噪声环境中。因此,语音增强的目的是减少语音中含有的噪声,提高语音信号的质量和可懂度。本文从研究传统的语音增强算法入手,分析了一些算法的优缺点。在人耳听觉掩蔽效应的基础上,对一种单通道语音增强算法提出了一些改进。针对语音和噪声同时进入人耳的噪声环境,本文提出了一种基于感知失真测度的语音增强算法,实现了在噪声环境中对语音信号进行增强的目的。本论文主要的工作和创新点如下:1.基于噪声去除的语音增强1)针对增强过程中容易产生语音失真的问题,本文介绍了一种低失真语音估计器。但是,该语音估计器的计算复杂度较高,且在低信噪比情况下,不能准确去噪。针对该问题,本文引入一个过减因子,降低了该语音增强的算法复杂度。改进后,该估计器能够根据信噪比的大小及时调整去噪增益,改进了增强效果。2)为了获得具有较高性能的语音增强系统,需要对噪声谱进行准确地估计。本文引入了一种低延时低复杂度无偏的噪声谱估计方法。该算法能够及时对信号每一帧的噪声谱更新,针对语音信号中含有的非平稳噪声,它能够比较准确地对噪声谱进行估计。通过实验表明,相比传统算法,该算法拥有较好的性能。3)在对语音进行预估计过程中,采用的是基于对数谱最小均方误差的方法,该方法预估出的语音信号更符合人耳听觉特性。通过实验表明,将上述提到的噪声谱估计方法应用到该方法中,预估计的效果要优于传统的方法。2.基于听觉感知的语音增强在语音信号和噪声同时进入人耳的噪声环境中,针对需要对语音信号进行预处理的情况,本文提出了一种基于感知失真测度的增强方法。通过对人耳听觉系统的模拟,将语音信号的能量进行重新分配,使得人耳感知到的语音信号的失真测度最小化。在基于感知失真测度的增强系统中,可以针对不同的应用场景,调节算法的延迟时间,从而能够获得不同的增强效率。通过实验表明,在噪声环境中,该算法能够很好地对语音进行增强。
其他文献
桥梁涵洞是公路的重要组成部分,其施工质量的好坏直接影响公路的最终形成质量,本文将分析影响公路工程桥梁涵洞施工质量的因素,并对其质量管理对策做了进一步探讨。
本文全面介绍公路改建工程隧道开挖与支护、防排水、二次衬砌、地质超前预测预报与监控量测等方面的技术,解决了地质超前预测预报、光面爆破、无滴渗防水、二次衬砌等多项技术
阵列信号处理经过多年来的发展,时域、空域上所蕴含的信息已得到充分的挖掘。近年来,新的研究工作在极化上得到开展。作为一种既能感知极化信息又能感知时空域信息的接收装置
学位
现在,随着奥运会的临近,国内的许多观众届时都将首次体验到全新的数字电视转播带来的前所未有的视觉体验。从2003年以来,由于国家广播电视行业数字化的各项政策出台和发展目标的
空间光通信以其高带宽、高码率、高保密性及抗干扰等优点成为光通信发展的新方向,目前已成为各国研究工作的热点。信号光发射部分是光通信系统中不可或缺的,它直接担负着信号
近年来对新生儿疼痛的研究在世界上引起了广泛的关注。由于新生儿无法对疼痛进行自我表述,因此提出了各种不同的人工评估方法。其中,面部表情是所有评估工具都采用的一项测评指
在桥梁建设过程中,桥梁桩基结构质量的好坏成为了影响桥梁建设工程一个至关重要的影响因素。桥梁施工虽然有很大的发展,但在某些方面还存在一些安全质量的问题有待改善,本文将着
随着中国移动3G通信协议的发布,需要有性能优异、智能化程度高且价格低廉的3G直放站对偏远地区或是人口密集区的手机信号进行增强。而3G直放站监控系统被认为是3G直放站研发
随着超大容量DWDM系统在长途网中的大规模建设,用户接入及局域网的宽带化技术的普及,网络的瓶颈逐渐转移到了城域网。原先以承载话音为主的城域传输网络,已无法适应城域数据