语音通信中的非平稳噪声估计方法研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:c170910613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有单通道语音增强技术对平稳噪声的跟踪与消除能力较强,但对于现实生活中常见的非平稳噪声,往往会出现噪声估计不准确、噪声抑制效果较差的问题,因此非平稳噪声环境下的语音增强就成为实际应用中需要解决的一项课题。本论文的研究内容主要体现在以下几个方面:首先回顾隐马尔可夫模型(Hidden Markov Model, HMM)的基本原理和其在语音增强上的应用。其次,针对非平稳噪声环境提出了一种基于隐马尔可夫模型的语音增强方法。所提方法以激励能量和线谱频率参数(Line SpectrumFrequency, LSF)为特征,利用Baum-Welch算法分别训练纯净语音和噪声信号的自回归隐马尔可夫模型。在增强阶段,首先以归一化临界带功率谱为特征,利用高斯混合模型(Guassian Mixture Model, GMM)对背景噪声进行分类,而后利用纯净语音的HMM和对应类型噪声的HMM,在最小均方误差准则下估计语音和噪声的功率谱,并使用维纳滤波形式的谱增益函数对含噪语音进行增强。考虑到非平稳环境中训练集和测试集的差异性,提出了一种在线调整语音模型和噪声模型的方法。语音模型的能量调整采用迭代的期望最大化算法(ExpectationMaximization, EM);噪声模型的能量调整则利用的是模型训练过程中的能量重估方法,并以最小值控制的递归平均算法(Minima-Controlled RecursiveAveraging,MCRA)确定噪声能量调整的初始值。最后,为避免语音信号采集过程及语音增强等预处理模块对语音电平造成的影响,提出了一种网络端的压缩域自动电平控制(Automatic Level Control,ALC)方法。所提方法利用ITU-T P.56标准测定语音信号的实时电平,根据实时电平与目标电平的差异联合调整输入语音码流中的自适应码书增益和代数码书增益参数,从而达到将语音电平控制在听觉舒适范围内的目的。在国际电信联盟电信标准部(International Telecommunication Union,Telecommunication Standardization Sector, ITU-T)G.160标准下对语音增强算法进行性能测试。测试结果表明,与参考方法相比,本文提出的非平稳噪声估计方法能够较好的跟踪和处理非平稳噪声,噪声衰减量较大,收敛时间较短。自动电平控制的电平偏差在0.5dB以内,电平调整后语音的客观质量优于电平控制的参考算法。
其他文献
目的:探讨与分析甲硝唑联合乳酸杆菌及雌三醇在老年性阴道炎治疗中疗效.方法:抽选2018年1月-2019年9月在我院医治的老年性阴道炎患者(120例)开展研究,随机数表法分成对照组和
目的:研究泮托拉唑+维生素C治疗2型糖尿病合并胃溃疡的效果和安全性.方法:选择临床治疗的2型糖尿病合并胃溃疡患者作为本次研究对象,根据其入院顺序对其进行分组,将200例患者
目的:研究瑞芬太尼联合七氟烷应用在小儿眼科短小手术中的效果及安全性.方法:以2017年7月—2018年7月在我院接受小儿眼科短小手术治疗的94例患儿作为本次研究活动的观察对象,
目的:对比分析高血压致脑出血患者在临床治疗的过程中采用尼莫地平药物治疗时的应用效果.方法:选取我院所内科收治的高血压致脑出血患者60例作为研究对象,采用硬币投掷法随机
目的:评价宫外孕应用米非司酮联合甲氨蝶呤治疗的临床疗效.方法:选取我院妇产科于2018年6月至2019年6月收治的宫外孕患者50例入组,随机自愿原则下分为两组,对照组给予甲氨蝶
近年来,随着Web 2.0的发展mashup技术出现在开发者的视野中,在网络上出现了越来越多利用mashup技术构建的有个性的Web应用。但是目前出现的利用mashup技术构建的Web应用都是
锦竹(Hibanobambusa tranquillansf.shiroshima H.Okamura),属于阴阳竹属,原产日本,是一种观赏价值极高的珍稀彩叶竹种,国内对该竹种的研究还未见报道。本文对锦竹的分类地位、生物
目的:分析血塞通联合依达拉奉治疗脑梗塞的临床价值.?方法:择取本院收治的脑梗塞患者76例进行分析,选取时间自2018年2月~2019年2月间.根据治疗方式不同分为对照组、研究组,分