面向语音分离的深层转导式非负矩阵分解并行算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ZPHZPH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音、图像、文字等作为传承世界文明的载体,极大程度地丰富了世界文明发展史,一直是学术界与工业界研究的重点,随着数字化社会的不断发展,人们希望从这些载体中提取到更有用的信息,当这些信号以矩阵形式进行表示并进行运算时,可以解决生活中的实际问题。本文主要以语音分离为研究背景,针对语音分离过程中矩阵分解效果与效率问题进行研究。首先,由于分离场景的不确定、分离对象为多说话人混合语音信号,存在信号特征表达不充分,分离效果与原语音信号存在偏差等问题;其次,语音分离过程需要更新迭代法则使得矩阵乘积近似表示原矩阵,随着矩阵乘法过程中阶数选择以及更新过程中迭代次数的不同,使得问题复杂度提升,出现计算过程数据量增大,运算过程效率低,运算时间久等问题,无法满足语音分离场景中的实时性要求,限制了语音分离工业化的发展进程。针对面向语音分离场景下目前存在的问题,开展了研究工作,本文主要工作和成果如下:1.针对语音分离过程存在语音特征表达不充分问题,本文基于深层转导式非负矩阵分解(DTNMF)算法,提出迭代更新的DTNMF优化算法。在典型的非负矩阵分解算法基础上,先引入转导式学习思想,在分离阶段把混合语音信号加入到目标函数中,联合训练数据和测试数据生成字典;而后加入深层结构,在迭代更新过程中将基矩阵按层分解,通过每一层分解,能使每一层权重矩阵更精确表达出相应的属性,直到完成预训练过程;优化算法在迭代分解过程中,设定阈值,调整收敛步长,当目标函数收敛结果大于阈值,收敛速度加快,否则保持当前步长。实验结果表明:DTNMF优化方法在保持还原各说话人语音信号效果的基础上,能有效缩短分离时间。2.针对分离过程数据运算复杂、计算量太大、计算时间长等问题,提出了一种面向语音分离的DTNMF并行算法,在矩阵乘法运算过程中,将矩阵按照行列划分或summa算法块划分,使用进程间通信交换数据,协调并行计算过程,加速矩阵计算过程,实验结果表明,基于DTNMF算法的MPI并行算法在分离语音信号预训练及分离过程中能有效缩短分离时间,取得良好的加速效果。3.针对设计的MPI并行算法可能存在的负载不平衡等问题,综合考虑迭代更新过程的数据关联性,设计任务间和任务内多级并行算法。在任务级将分解训练语音得到对应基矩阵的过程作为两个独立的任务并行计算;在任务内部进程级采用把矩阵按行列划分或summa算法块划分;在线程级子矩阵乘法运算过程中,采用生成多线程,通过共享内存交换数据进行子矩阵块计算的加速策略,该算法为第一个实现深层转导式非负矩阵分解的并行算法。实验结果表明,在分离多说话人混合语音信号时,不改变分离效果的前提下,所提出的并行算法时间大大缩短,能够有效提高分离效率。
其他文献
近年来,随着芯片集成程度的增高和So C(System-on-a-Chip,片上系统)技术的快速发展,微电子机械系统其中一个重要分支微机械陀螺仪的性能也在不断的提升。微机械陀螺仪可以为惯性导航系统提供导航信息,同时还可以应用于汽车、消费电子应用中,用途十分广泛。通常情况下,接口电路往往会成为微机械陀螺仪的发展瓶颈,因此本论文研究其中最重要的模数转换器。Sigma Delta ADC(Analog-
近年来军事指挥信息系统的建设成果十分显著,但未来战争会存在更高要求的态势理解、快速决策等问题,这些都是系统智能化所面临的瓶颈。面对这一现状,同时考虑到信息化军事指挥决策带有的“人-机”特性,在军事指挥信息系统中通过智能人机交互帮助指挥员提高关键信息的获取能力、提升决策效率,是突破系统认知智能方面瓶颈的重要发展方向。以语音交互为主的人机交互形式能大幅度提升指挥员的作战态势感知能力和决策水平。此交互过
高功率微波在受控热核聚变、雷达通信、新材料、环境保护等很多学科领域具有巨大发展前景,作为高功率微波产生系统的重要组成部分,高功率微波源被高度关注和研究。为了拓展应用前景,高功率微波源需要向紧凑轻小型方向发展,以适用于不同的平台,同时,当高功率微波器件工作在长脉冲条件下时,其单脉冲能量和系统整体运行效率将大幅提升,从而大幅提高其作用效力。Ku波段高功率微波有较大的应用潜力,但是受高频段器件尺寸影响,
随着互联网技术的不断成熟,在线教育也得到了蓬勃的发展。尤其是在IT编程领域,由于其技术类型品类繁多,更新换代快,按需教学的在线教育模式正好迎合了广大IT人士的深层需求。计算机领域属于典型的工科领域,单纯的文字或视频课程教学缺乏实践性,学员在课上学习到的内容不能得到有效吸收;而现有的部分在线编码平台,仅仅能提供一些传统的基础算法知识的在线编程和考核,无法提供工程级技术的支持,编程教育存在着与企业需求
表面等离激元(Surface plasmon polaritons,SPP)在本质上属于一种电磁场,存在于介质与金属层之间且由集体电荷振荡产生。它能在亚波长区间实现对光场的控制、局部增强效应、突破衍射极限等。电磁感应透明(Electromagnetically Induced Transparency,EIT)效应是本质上说是原子与外界光场的一种量子层面的相互作用,这种相互作用会产生强烈的干涉效应
随着国家城镇化进程不断推进,城市越来越拥挤,人们的出行效率逐渐变低。出租车(网约车)是城市公共交通工具之一,每天都在产生大量的订单数据,它的出行订单需求和订单分配一直影响着出行公司的决策和车辆调度,从而影响人们的出行效率,准确的出行订单需求预测有助于人们错峰出行,合理的订单分配策略可以减少人们在出行过程中消耗的时间。当前订单需求预测和订单分配分别还存在以下不足:(1)可利用特征少,未考虑区域特征对
开源软件项目作为一种群体协作创新的产物,其迅猛发展积累了海量的可复用资源,为软件创新学习和创新实践提供了坚实的基础。然而项目的快速迭代以及全方面发展,也同时为项目资源的检索和复用带来了挑战。目前大多数搜索引擎和开源社区通过搜索关键字获取开源代码,然而这些关键字大多是基于代码的。因此,当开发者不知道如何实现某个方法时,就无法通过搜索代码来得到自己想要的代码片段;而如果项目注释质量低,代码注释就很难对
稀薄空气动力学是探讨稀薄气体流动问题中质量、能量传递连同产生的化学反应规律的一门学科。由于环境真空度很高,稀薄效应显著,传统的连续性方法不再适用。等离子体羽流作为稀薄流的一个重要分支,主要应用于等离子器件分析及等离子体推力器等领域。随着高性能计算技术的发展,通过数值模拟研究等离子体羽流成为重要的研究手段和热点方向。直接模拟蒙特卡罗(Direct Simulate Monte Carlo,简称DSM
现代船舶通信以安全、高效、智能为目标,其发展趋势主要体现在:船岸通信一体化、船岸管理一体化、船舶监控智能化、应急处置自动化,确保通信更加顺畅,确保船舶航行更安全。面对高标准的管理、监控、安全要求,陆地各业务主管单位均实现了岸船管理一体化系统,陆地和海洋船舶通信迅速融为一体,但是由此导致了多个应用软件无序竞争有限的卫星通信带宽资源,容易造成信息传输速度慢、冗余大、效率低、稳定性差,无法满足业务主管单