鲁棒性语音识别的特征提取与模型自适应算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:yuyisea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
迄今为止,语音识别系统的性能得到了很大提高.然而,当识别环境和训练环境失配时,其识别性能会急剧下降.提高语音识别系统的鲁棒性是决定其能否实用的关键因素之一,是目前语音识别系统需要迫切解决的关键问题.本文从语音信号抗噪声特征参数提取算法和HMM声学模型自适应算法两个方面着手,对基于HMM语音识别系统的抗噪声特性进行了研究,同时对基于听觉特性的语音增强算法进行了初步研究.提出了一种在加性噪声环境下具有良好抗噪性的语音特征参数,称为DAS-WLPCC倒谱系数,该参数充分利用了自相关函数序列的动态信息,利用频率规整的LPC分析近似人耳听觉感知特性,从而使得该参数具有良好的抗噪声性能.实验结果表明相对于常规的特征参数,该参数在各种噪声的不同信噪比情况下,语音识别系统的误识率都有显著地降低.针对加性噪声和卷积噪声的影响,本论文提出了一种对加性噪声和卷积噪声均有效的抗噪声语音特征参数,首先根据噪声频谱比语音信号的频谱变化更慢的特点,引入了频谱差分法,消除加性噪声的影响,然后在倒谱域进行归一化处理,消除卷积噪声的影响.实验结果表明在加性噪声环境下,该参数与DAS-WLPCC识别性能相当,且优于MFCC,但当存在卷积噪声时,其识别性能明显优于DAS-WLPCC和MFCC.模型自适应算法是解决识别环境和训练环境失配的有效方法.本论文对模型自适应算法在抗噪声语音识别中的应用进行了深入研究,提出了一种基于最大后验非线性变换的模型自适应算法,称为MAPNT算法,并给出了变换参数的重估公式.最后对MAPNT算法、MLLR等算法进行了的实验比较.实验结果表明仅需少量自适应数据的情况下,该算法就可以明显地提高系统的识别性能,其性能优于MLLR等算法.对语音增强算法进行了初步的研究,提出了一种基于听觉掩蔽效应的语音增强算法,该算法克服了常规的谱减法残留的"音乐噪声"大的缺点,使得增强语音在信噪比和残留的"音乐噪声"之间得到较好的折衷,有效地降低了增强后的语音中残留的"音乐噪声",提高了增强语音的听觉效果.
其他文献
嵌入式系统广泛应用于控制领域、信息家电、工业、农业、商业、服务业等各行业,已成为现代电子设计的一大领域和方向.而嵌入式操作系统是嵌入式系统的灵魂,成为操作系统研究
调制域为人们提供了一个新的分析信号的窗口,而在此基础上发展起来的调制域分析技术作为一种全新的复杂信号分析技术,在很多领域中已经越来越重要。应用该技术研制出的调制域
移动自组网以其高度的灵活性和抗毁性一直倍受军方和学术界的关注,近年由于移动计算技术的进一步发展、便携式笔记本以及各种手持通信设备的普及,移动自组网再度成为研究的热
随着通信的发展,对电信业务的管理提出了更高的要求,管理现代化的呼声也越来越高。电信线路资源的查询难、管理难和维护难成为当前的热点问题。实现电信资源管理的自动化和智能
无线单片系统式(SoC)单片机的诞生为短距离无线通信提供了非常简单的解决方案,它是开发低成本、低功耗无线通信系统的理想方案。Nordic VLSI公司的nRF24E1正是一种主流的、优
未来移动通信网络能够提供诸如话音、可视电话、高速互联网接入和移动计算等多媒体业务,然而由于无线频谱的有限性和用户的移动性,又因为网络业务量的复杂性和自相似性,一旦
作为阵列信号处理中的关键问题,DOA估计一直是研究的热点,其中超分辨DOA估计算法更是一经提出就以其卓越的性能受到了大家的关注,极大地推动了测向技术的发展。但在实际工程中,基