音视频跨模态声源分离研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:xtzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声源分离任务是音频领域相对古老的任务之一,最初提出时,被赋予“鸡尾酒会问题”这个优雅的名字。该问题最初旨在解决复杂场景下人声分离的问题,后随着问题复杂程度提升以及应用场景的发展与变化,逐渐被分为人声分离、人声与背景声分离以及音乐源分离等分支任务。早期解决该问题的方法多试图从硬件方面考虑,例如设置麦克风阵列来增加声音通道数,然后利用信号处理的相关方法进行处理,分离出不同的人声。后随着神经网络以及深度学习的快速发展,人们通过设计网络框架,通过深度学习的方式实现声源分离。但随着研究的深入,通过设计复杂的网络来实现声源分离逐渐到达了一个瓶颈。这是因为随着对分离性能的需求越来越高,不同声源之间在时频域上的交互和重叠问题逐渐开始被考虑,而这种重叠在音乐源分离上尤为严重。与此同时,鉴于深度学习在其他领域的成功应用,研究者们试图将所用数据从音频这种单一模态扩展到多模态数据,通过建立音视频跨模态信息之间的关联与对应,突破以往仅用音频数据所面临的性能瓶颈。使用跨模态信息进行声源分离所面临的挑战有两点,一点是实现不同模态信息的准确对应,二是获取高质量的声源分离结果。因此,本文应对这些挑战,做出了如下工作:1.在音视频跨模态信息对应上,通过对视觉信息中的发声声源进行预检测与预筛选,使得在不同模态信息进行对应时,能够排除不相关数据的对应,使得匹配更加准确。因此本文在基于Faster R-CNN目标检测方法的基础上,通过对视频信息中的手部位置和朝向进行检测确认,并基于此对目标检测结果进行复筛,以排除目标检测模型在泛化效果不好的数据上进行检测时出现的错误结果所带来的负面影响。本文对提出的筛选方案进行了实验验证,证明了算法的有效性。2.对于分离结果,本文建立信息残差的概念,通过将信息残差与视觉信息相结合,对分离结果进行多次循环修正,使得分离结果的信息不足时得以补全,信息溢出时得以削减,最终更接近于理想的真实分离结果。本文对信息残差的设置以及循环修正的方案进行了完整的实验验证,证明了本文算法的有效性。3.本文在多个大型数据集上对本文算法进行了验证,与该领域最新方法进行了对比,取得了最好的结果,证明了本文算法有效性以及优秀的泛化性能。
其他文献
在福建霞浦等地发现的摩尼教科仪文书中,《借锡杖文》《借珠文》和《付锡杖偈》三篇科仪文内容与“目连”直接相关,与其相关的内容在其他霞浦文书中也有所见。“目连”传说原本诞生于佛教,流传范围广泛,后来又衍生出“血盆信仰”,并逐渐被道教和民间传统文化所吸收,形成了相关的科仪。是知,“目连”与“血盆信仰”在霞浦摩尼教文献中出现,这一方面说明摩尼教对佛道和民间文化的杂糅,另一方面也说明霞浦摩尼教已逐渐融入闽地
在新的"高考"政策下,在高中阶段开展职业生涯发展和计划课程的实施具有十分重要的意义。高中生涯规划的实施,事关学生的发展和国家的前途,是目前中国高中教育的一个不容忽视的重要内容。因此,在对高中生涯规划课程实施过程中,教师生涯规划课程设置的问题进行了深入的剖析,并提出了相应的对策。
本文针对南宁市中学生生涯教育现状,论述在积极心理学视角下构建中学生生涯教育课程目标和内容体系,创设中学生生涯教育指导课程、生涯教育与学科融合课程、生涯教育综合实践课程、生涯教育家长指导课程,帮助学生了解并适应社会发展需求,建立学校学习与未来发展的内在联系,为中学生生涯教育提供了新的途径,提高了中学生生涯教育工作的成效。
<正>出版社:中华书局出版时间:2020年11月摩尼教是公元3世纪由摩尼在波斯创立的世界性宗教。摩尼死后,摩尼教传入中国,并在公元8—9世纪因受回鹘崇奉而得到广泛传播。唐武宗会昌灭法后,摩尼教在国内受到沉重打击,在呼禄法师带领下逃往福建,此后逐渐吸收中国的本土宗教,在民间继续存在,因其后续缺乏清晰的记载而使人们对其的理解受限,并认为摩尼教已湮没于历史的尘埃之中。
期刊
目的 探索急性缺血性脑卒中(acute ischemic stroke, AIS)合并糖尿病人群的血糖变异性与神经功能损害的相关性。方法 选取AIS合并糖尿病患者125例,记录基线状态下一般临床资料,并分别于入院及出院时进行美国国立卫生研究院卒中量表(National Institutes of Health Stroke Scale, NIHSS)评分,于出院1个月后随访进行改良Rankin量表
学位
认知心理学认为,完整的认知包括认知输入、认知加工和认知输出三个环节。以此观点为基础,余文森教授提出了与三个环节对应的"读思达"教学法。该教学法能让学生明确"写什么"、"怎么写",并帮助下笔困难的学生"写下来",可普遍运用在小学阶段的习作教学中。
对高中物理课堂教学如何引入开放式教学,从设计开放性驱动任务、引导学生自我设问、展示不同问题解决方法、设计开放性教学评价等方面,结合具体教学案例作出论述,为科学而系统地提升学生深度学习能力和思维品质提供参考依据。
近年来,中国加快建立开放型经济新体制,深入推进服务业改革开放,服务贸易实现快速发展,正日益成为对外贸易发展和对外开放深化的新引擎。然而,在此背景下,服务贸易仍是中国对外贸易的短板,中国服务贸易总体发展水平落后,服务贸易结构不合理,服务贸易总体逆差状态仍未改变。而当前国际经济形势复杂多变,各国贸易摩擦不断加剧。基于此,“十三五”以来,我国积极发展服务贸易,着力营造良好体制环境。2016年,国务院在上