基于监督学习构建维纳滤波器的语音增强方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:weigangming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,语音增强在我们的日常生活中已经取得了广泛的应用。因此,在过去的几十年间,许多不同的语音增强方法已被提出。尽管如今已经有了大量基于监督式学习的语音增强方法,但其仍然存在两个问题。首先,由于许多有用的语音信息都存在于谐波间,因此语音的谐波恢复对语音增强至关重要。然而,目前基于监督式学习的语音增强方法对于谐波恢复和去除谐波间噪声的能力有限。其次,这些方法通常没有较好的泛化能力。解决该问题或许可以在训练阶段增加噪声、带噪语音和纯净语音的数量,从而使其包含更多的噪声环境。但是,这样就需要获取大量的平行数据集,而大量平行数据集的获取确是十分困难的。为解决以上两个问题,本文提出了三种基于监督学习构建维纳滤波器的语音增强方法。首先,本文利用码书和语音的谐波结构来进行语音增强。该方法能有效地去除存在于语音谐波间的噪声。在该方法中,本文首先利用语音的谐波结构去估计了先验语音存在概率,然后利用该概率估计噪声的自回归(Autoregressive,AR)谱形状。此外,该先验语音存在概率也被用于修正维纳滤波器。最后,本文通过结合纯净语音的AR谱形状码书构造修正后的维纳滤波器,从而实现语音增强。其次,本文尝试利用语音倒谱和深度神经网络(Deep Neural Networks,DNN)实现语音增强。该方法能有效地恢复出语音的谐波结构,进而获得更加高质量的语音。在该研究中,本文将带噪语音倒谱作为DNN的输入,直接预测纯净语音的倒谱和理想维纳滤波器,从而实现语音增强。此外,本文还提出一种结合倒谱特征和维纳滤波器的混合框架,进一步提高增强语音的质量。最后,本文提出了一种基于长短时记忆神经网络和条件生成对抗网络的语音增强方法。该方法包含一个生成器和一个区分器。由于生成器和区分器都具有长短时记忆神经网络的结构,因此其更适合于语音增强任务,并能比之前方法更好地恢复出语音的谐波结构。该方法将带噪语音倒谱作为DNN的输入,直接预测纯净语音的倒谱和理想维纳滤波器,达到实现语音增强的目的。另外,基于生成对抗网络的特性,本文还提出了一种新的不依赖于平行数据集的语音增强方法。该方法利用了循坏一致对抗神经网络,有效地降低了训练DNN所需数据的要求,有效提高了DNN的泛化能力。
其他文献
针对无线传感器网络节点能量少、存储空间小、计算能力有限的特性,本文提出了基于遗传算法(GA)和LMBP神经网络融合算法的入侵检测模型。与传统方法相比,该模型利用神经网络离线
通过气相色谱分析幼虫信息素的10种酯类在中蜂和意蜂成年工蜂的分布情况。将成熟的封盖子脾提至人工培养箱中孵化,幼蜂出房时对其进行标记,再放回原群中。取刚出房幼蜂、10日
为提高采棉机器人对成熟棉桃的正确识别率,提出一种基于形状特征的粒子群优化算法(PS0)优化支持向量机(SVM)的判断方法。首先在OHTA颜色空间下对棉花图像进行分割,然后提取棉花的形
一、选题背景和意义风电业务单位多属于项目公司,主要业务是风电项目的前期开发、工程基建监管和综合管理工作,它们设立在全国各地,特点是人员分散、一岗多责、管理灵活且专业化
超市为人们的购物带来了便利,成为了人们生活的一部分。但是,当前超市的卖场现状仍存在诸多的问题,首先来看,超市内部的环境质量较差,这将影响顾客的购买欲,导致超市经济效益