基于深度学习的信号分离若干问题研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jipin226
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现实环境中,人们感兴趣的语音信号通常会被噪音或其他背景音所干扰,这些噪音对现实语音质量存在严重的损害,也对语音识别模型的性能存在一定考验。为了区分真实语音中的噪音和混合的目标说话人声音,语音分离技术是最常用的方法。近年来,得益于深度学习的发展,语音分离技术取得长足进步,但也仍然有许多难点,对于分离后的语音信号的恢复程度和纯净度仍需要不断提升。因此,基于以上背景,本文围绕独立成分分析、语音视频处理、生成对抗策略和梯度约束策略等相关技术方面对语音信号的分离任务展开研究。在论文的主体部分中,文章以深度学习方法为基础,主要解决的问题是对混合的语音信号进行分离,得到纯净的目标语音。针对以上问题,本论文基于独立性分析和相关性抑制的思想方法,提出了以下几点新的应用方案:(1)本论文以语音信号作为输入,提出了一种基于独立性分析方法的单通道语音分离结构,以及一种基于相关性抑制方法的单通道语音分离结构。在独立性分析方法的结构中,该结构通过分离和重采样模块获得混合信号的联合采样和边缘乘积采样,使用对抗网络的思想不断优化两种采样的相似度,从而保证分离信号之间是相互独立的;在相关性抑制方法的结构中,该结构从最小化分量信号层之间相关性的角度进行切入,在基线模型中融合了一个新的梯度约束损失,它关注信号之间的边缘梯度信息分布的互不干涉性,使分离任务在优化过程中取得更好的效果。(2)本论文以图像结合语音作为输入,提出了一种基于频域的独立性分析方法的语音分离结构,以及一种基于频域的相关性抑制方法的语音分离结构。在基于频域的独立性分析方法的结构中,该结构依据对抗性博弈的思想,利用分离、重采样模块和生成对抗式的优化策略,使得各个被分离信号之间保持相互独立的关系,从而提升分离效果;在基于频域的相关性抑制方法的结构中,通过在频域表征空间内对各个分量信号的相关性进行约束的方法,保证分量信号之间的边缘信息有足够的区分度,使其本质结构不在分离的过程中发生改变,从而提高对含有多种背景声音的视频语音分离任务的精度。
其他文献
人类的大脑具有一个非常复杂的工作机制,多年以来,很多国家的学者一直在深入研究大脑的工作原理。大脑成像技术的进步,让人们对人脑的探索从最开始的解剖定位发展到人脑活动
明代是文人崇古尚风雅极为繁盛的时代,尤其在明代中晚期,由于商品经济的迅速发展让社会积累了足够的资本,好物之风尤盛。《长物志》是这一环境下集大成者的优秀作品,本文基于
低血糖昏迷是糖尿病患者服用降糖药的严重副反应,老年糖尿病患者因身体各方面功能减退尤易发生。而且老年糖尿病患者多合并心脑血管疾病、肝肾肺功能不全,发生低血糖昏迷时容易
在中国当代文坛,大约还没有哪位作家像迟子建那样如此深情的驻足东北、近观东北、书写东北。三十余年的创作,她用充满温情的眼光“玄览生灵,沉淀沧桑”,为东北的风土人情、山川地貌、历史传奇书写了六七百万字的作品。无疑,迟子建用三十余年的文学创作,写出了属于“文学东北”一份独特的“滋味”,在这份“滋味”里,东北饮食某种程度上也具有了很大的审美内涵与张力。故本文以迟子建小说中的饮食书写为切入点,通过分析梳理迟
网络攻击对网络和信息系统的危害非常大,有必要对网络攻击的过程进行研究和分析,网络攻击链模型是描述攻击的一个好的模型。网络攻击链模型描述了攻击过程,有助于进行威胁情
新一轮教育改革强调着力发展学生的核心素养,同时新课标指出学科内容只有和具体的问题情境相融合才能体现其素养意义。即高中思想政治学科核心素养的本质内涵就是运用该学科
基本情况 浙江省供销合作社涉农电子商务主要围绕农产品流通和农资服务展开,在农产品流通方面,着眼“网上供销”和“平台服务”两条主线,一方面积极推动系统供销合作社“触电”,
一、游戏目的发展学生的传接球能力,体现学生动与静的完美接合,塑造学生的形体美。二、游戏准备参加游戏的学生围成一个大圆圈,两两之间的距离约为2米;准备一个篮球。三、游
期刊
利用大型有限元软件ABQUS对FRP约束混凝土方形倒角截面轴心受压短柱进行分析,分析结果表明:ABQUS分析结果与试验结果吻合较好,采用ABQUS软件对FRP约束混凝土方形倒角截面轴心受
随着法治进程的逐渐深入和公民公共权利的意识觉醒以及《环保法》《民诉法司法解释》等规范性文件对于民事公益诉讼规则的具体明晰,公益社团如雨后春笋般日益涌现,民事公益诉