基于广义旁瓣抵消器的语音增强算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wan801130
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代通讯技术的迅速发展和普及给人们的生活和工作带来极大便利,然而也使得通讯过程所面临的环境更加复杂,由此增加了通讯时目标语音受到各种类型信号干扰的概率。为了保证通讯质量,需要解决如何抑制这些不同类型的干扰信号,同时尽量降低目标语音信号的失真问题。  使用语谱等特征实现语音增强的单麦克风技术容易造成目标语音失真,而波束形成算法利用麦克风阵列得到信号的时域和空域特征,可以获得相对较高的目标语音质量,因而成为语音增强的重要研究方向。波束形成语音增强算法一般采用固定波束形成和自适应波束形成相结合的方法,这形成了广义旁瓣抵消器波束形成算法的思想。其中固定波束形成用于增强目标方向信号增益,而自适应波束形成用于抑制旁瓣干扰信号。  本文在分析各种麦克风阵列语音增强算法的基础上,结合广义旁瓣抵消器的思想,根据语音增强应用领域和声学环境的不同,分别从双麦克风小阵列、常规麦克风阵列两个方面展开研究,完成了如下一系列工作:  1.在非混响环境下,提出一种基于零陷谱减的双麦克风小阵列广义旁瓣抵消器算法。在手机和助听器等设备中,由于受到空间和成本等条件的限制,一般采用双麦克风小阵列。双麦克风小阵列难以通过常规固定波束形成器获得较好的目标方向信号增益,使得采用标准广义旁瓣抵消器实现语音增强的效果受到一定限制。当阵列接收到的信号仅受时延和衰减变化影响,或者当混响干扰影响可以忽略不计时,双麦克风阵列存在一个目标方向的“零陷”信号。基于此,本文提出在广义旁瓣抵消器的固定波束形成支路中,加入一个零陷谱减的方法,用以抑制部分干扰信号,实现提高固定波束形成在目标方向的信号增益,从而获得更好的语音增强效果。  2.在混响环境下,提出一种基于相干滤波的双麦克风小阵列广义旁瓣抵消器算法。在室内环境中,目标信号传播过程中会受到不同物体的多次反射而导致阵列中目标方向“零陷”信号很难得到,并且混响干扰会严重影响波束形成算法的语音增强效果。为了克服上述问题,本文使用迭代相干滤波作为广义旁瓣抵消器的固定波束形成支路,用以去除混响对干扰信号抑制的影响,从而可以在一定程度上克服由于混响干扰导致双麦克风小阵列语音增强效果受限的问题。  3.提出一种基于多任务稀疏表达的广义旁瓣抵消器波束形成算法。为了解决广义旁瓣抵消器语音增强效果受阵列尺度和阵元数影响的问题,本文提出把多任务稀疏表达的方法引入到常规麦克风阵列中,使之作为广义旁瓣抵消器的固定波束形成支路以提高语音增强效果。在多任务稀疏表达方法中,使用目标信号字典和干扰信号字典连接形成的组合字典,分离目标信号和干扰信号,并把分离出的干扰信号去除;同时保证目标方向信号在不同阵元间基本一致,而其他方向的干扰信号在不同阵元间不一致,则同一时刻在阵元间不一致的未被分离出的干扰信号,可以部分的被多任务稀疏表达去除。因此在广义旁瓣抵消器中使用多任务稀疏表达方法代替传统的固定波束形成器,可以为常规麦克风阵列提供更为有效的干扰抑制支持。  4.提出一种基于参考干扰信号稀疏编码的广义旁瓣抵消器波束形成算法。参考干扰信号中含有泄漏的目标信号是制约广义旁瓣抵消器语音增强效果的重要因素,为了克服这个问题,本文提出使用稀疏编码方法抑制参考干扰信号中泄漏的目标信号,利用非语音段的干扰信号学习得到干扰信号字典,该字典可以稀疏重构与干扰信号相关的参考干扰信号,同时泄漏进参考干扰信号中的目标信号,由于与其不相关而不能被重构,从而能够提高广义旁瓣抵消器波束形成算法的语音增强效果。
其他文献
本文详细介绍了作者通过对目前数据库访问技术存在的问题进行研究后,设计实现的一个可以跨多种数据库平台进行访问的通用数据库管理工具。 在目前的数据库环境下存在着一个
该文研究了虚拟现实技术及其在分子结构三维可视化上的应用,对国内外的现状进行了介绍、研究、分析和比较,并结合中学化学教育的特点,设计了一个基于虚拟现实技术的中学化学
该文以机器学习、进化计算和上下文无关文法为背景,通过理论和实践相结合,在对遗传程序设计方法全面了解和对其模式理论分析的基础上,着重研究了个体表示、相应的遗传操作和
该文给出从函数式语言Haskell到过程式语言C的转换技术.文中详细地介绍了转换中涉及的几项关键技术,包括:对于高阶函数定义,以及函数的Curry化应用,采用实例化的方法,将其转
该文的工作主要包括以下几个方面:(1)采用Qmail+LDAP+Linux建立并实现了一个WebMail系统.该系统以Qmail作邮件代理、LDAP服务器存放用户帐号信息、JSP技术编程,具有较好的安
该文首先研究了分组密码的一般原理和基本的设计原理.然后分析了Rijndael算法的基本结构和实现原理,并且用C语言实现了该算法.Rijndael算法采用的是典型的代替/置换结构,数据
该文首先介绍了P2P技术的概况,并将它与传统的Client/Server模式做了比较.显示出P2P技术的优势与不足.然后在对现有的面向文件共享的P2P协议进行研究的基础上,从系统结构和加
随着互联网与信息技术的飞速发展,现今社会的信息量呈爆炸式增长,而人们对信息获取的需求也越来越大。伴随着传统搜索引擎的成熟,社交网络的兴起,社交媒体的丰富,人们可以获取信息
元计算系统(简称元系统)是可以作为虚拟的整体而使用的地理上分散的异构计算资源,这些资源包括主机、数据库和超级计算系统等.元计算系统在硬件和软件等方面均有异构性,适合
流媒体是指采用流式传输的方式在Internet播放的媒体格式,而流式传输方式则是将整个音频和视频等连续媒体文件经过压缩后,由服务器向用户计算机连续和实时传送.针对网络I/O的