基于卷积神经网络的语音增强算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lqylzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能越来越成熟的今天,语音技术已成为一个关键的人机交互接口。然而现实生活中的各种背景噪声,严重地干扰了语音交互。为提高语音交互效果需要进行语音增强,过滤掉语音交互中的噪声信号,提高沟通语音的清晰度、理解度和流畅度。传统的语音增强算法中,谱减法存在着出现“音乐噪声”的缺陷,其他算法也存在着难以处理非平稳性噪声等弊端。针对此,本文基于平稳快速递归最小二乘法(SFTRLS)与卷积神经网络(CNN)对语音增强算法展开研究,论文主要贡献如下:(1)提出一种基于CNN的噪声识别算法。该算法针对不同种类的噪声对语音信号造成不同影响,识别出环境噪声的种类参数,让增强模型可适用于不同的噪声环境,提高算法的自适应能力。实验结果表明,CNN的噪声识别率高达99.97%,相比于基于KNN模型、支持向量机的噪声识别算法,本文所提的噪声分类算法效果更佳。(2)提出一种结合CNN与SFTRLS的语音增强模型--SFTRLS-CNN。该模型以噪声识别的输出为输入,利用SFTRLS算法收敛性能和对非平稳噪声抑制性比一般传统算法效果更好以及对遗忘因子依赖较强的特点,通过线下训练学习到SFTRLS针对每种噪声处理的最佳遗忘因子。在线上运用中,算法匹配到最佳的遗忘因子系数,然后通过SFTRLS对含噪语音进行增强处理。实验表明,该算法的学习可达到99.40%的准确率;同时相比一般的SFTRLS,语音感知质量评价PESQ值(主观语音质量评估值)更高,失真程度也更小。
其他文献
"花糯饭"是一种以优质糯米为主要食材,采用多种天然植物提取的植物染色剂将其染色,按照传统的烹饪方式加工而成的彩色糯米饭,它是云南文山壮族特色饮食文化的重要组成部分。
在各种反舰导弹总体设计和打击效能评估中,末制导律的建模仿真均为一项非常重要的内容。将导弹、目标的三维运动轨迹解耦成垂直平面和水平面的运动,分别在两个正交平面上实现
生物教学如何培养学生的发散思维能力?本文试从以下几方面作一简述.  一、图示发散  充分利用课本中的插图,由图发散出结构,由结构发散出功能.如在复习'细胞的结构与
不动产登记行为的实施涉及民事、行政等多种法律关系,登记结果的准确与否直接影响登记的公信效力,不动产登记法律责任更是不动产登记制度中不可忽视的重要一环。但任何一种体
工程成本控制在当今激烈的市场竞争中愈发重要,它是燃气公司重要的工程管理环节之一。良好的工程成本控制,有利于降低成本造价、增加企业经济效益、提高市场竞争力。反之,将
<正>银行业与保险业的合作与融通起源于20世纪80年代的欧美,因其通过优势互补充分利用了银行、保险的双重资源优势而得到迅速发展,在经历了几个席卷全球的金融业并购重组浪潮
会议
本文将论题置于20世纪报告文学发展史的宏观背景中,通过对解放区报告文学的微观检视,具体地揭示论析解放区报告文学的创作特征及其文学史意义。全文分为三部分:新题材:“斗争
长期以来,我国的燃气工程所强调的都是资深的社会效益和环境效益,不过随着我国社会主义市场经济体制的建立,燃气行业也开始了市场化发展的道路,因此燃气工程造价控制工作就被提升
为使再入飞行器攻击目标时获得最大毁伤效果,基于弹目相对运动方程,并考虑落角等多约束条件,用线性二次型(LQR)最优控制的黎卡提方程,设计了一种新的最优末制导律,并给出了零阶
由于佳乐麝香(HHCB)被广泛应用于日用化工产品中,被持续不断地释放到环境中,所产生的生态风险已引起越来越多的重视。为探究HHCB的生态毒性效应,在水培条件下考察了不同浓度HHC