非平稳噪声环境下的语音增强研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:zl9881123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音常常受到背景噪声的干扰而使语音质量下降。在这种情况下,我们可以使用语音增强技术抑制背景噪声,提高语音质量。 语音增强的方法有很多,其中谱减法由于原理简单、运算量小,得到广泛应用,但是它在抑制背景噪声的同时会产生“音乐噪声”。因此本文主要围绕如何抑制“音乐噪声”展开研究,并完成以下工作: ◆本文分析了Doblinger和Cohen噪声谱估计方法的优点和不足,并在他们的基础上提出了一种快速自适应的噪声谱估计方法。实验证明,该噪声谱估计方法解决了背景噪声突变情况下,Cohen噪声谱估计方法中估计噪声谱的延时问题,并且还提高了估计噪声谱的准确性。 ◆本文分析了平滑的先验信噪比曲线能够抑制“音乐噪声”的原理,然后从先验信噪比的定义出发,提出了一种有效的先验信噪比平滑方法。实验证明,本文方法解决了直接判决法在语音开始端能量较大情况下,先验信噪比的延时问题;同时结合该方法实现的基于小波阈值多窗口功率谱估计的语音增强方法能够有效抑制“音乐噪声”,但它是以增大语音失真为代价的,其中辅音和能量较小的元音共振峰损失较大。 ◆本文提出了基于先验信噪比和人耳听觉掩蔽效应的语音增强方法。基于先验信噪比和人耳听觉掩蔽效应的语音增强方法是在Virag方法的基础上,使用先验信噪比进一步细化调节频谱衰减因子中的噪声谱权重系数。实验证明,相比Virag方法,该语音增强方法在不增大语音失真的前提下,进一步抑制了“音乐噪声”;相比基于小波阈值多窗口功率谱估计的语音增强方法,该语音增强方法在抑制“音乐噪声”的前提下,进一步减小了语音失真,尤其是辅音和能量较小的元音共振峰损失明显减小。
其他文献
通用移动通信系统 UMTS(Universal Mobile Telecommunications System)作为3GPP 制定的一个完整的第三代移动通信技术标准,并不仅限于无线接入网络(Radio Access Network,RAN),
图像配准是数字图像处理领域一个非常重要的分支,它解决同一场景在不同时间、不同角度由相同或者不同的光学设备得到的存在相对旋转、平移及缩放的两幅或者多幅图像的配准问
3D电视节目的舒适性制作技术是当前3D电视应用的基础性工作,因摄像机间几何位置偏差而导致的垂直视差对于3D电视的舒适性有着重要的影响,通过极线校正处理可以去除因几何失真而
随着网络技术的发展和 IPv6 技术商用进程的不断进展,越来越多的设备接入到网络中来。这些网络设备往往由许多相对独立的可管理模块组成,并要求实现灵活扩展,以满足特定的应用。
近年来,数字电视的发展非常迅猛,就国内来说,北京奥运会将采用高清数字电视进行转播,全国的各个地区和城市也都陆续得用数字电视取代了模拟电视,或者正在筹划着用数字取代模
分布式遗传算法 (Distributed Genetic Algorithms,DGAs)不但继承了传统遗传算法的优点,更具备了分布并行的特色。遗传进化过程中各台计算机虽然相互独立,但又可通过网络交换遗
随着3G标准的制定,下一代移动通信系统(4G)的研究也日益受到人们的关注。OFDM(Orthogonal Frequency Division Multiplexing) 正交频分复用技术将高速串行数据流分割为低速的
针对 GPS 载波相位技术在姿态测量中的应用,以船体为对象进行姿态测量算法研究。论文论证船体 GPS 姿态测量系统的可行性,详细推导姿态测量的数学模型,并给出影响 GPS 测量精度
学位
MIMO (多入多出系统) 和 OFDM (正交频分复用) 技术是未来无线通信的关键技术,具有广阔的应用前景。MIMO 系统在发送、接收端均使用了天线阵,天线之间的间隔足够大的时候,可以在