基于深度度量学习的跨模态检索研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ninghong0319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网和社交媒体的快速发展与普及,多媒体数据呈爆炸式增长。图像、视频、文本和音频等构成的相互融合的跨媒体数据在形式上呈现多源异构,同时语义上相互关联。为了有效地组织、管理和检索海量多媒体数据,使用户摆脱媒体类型的限制,跨模态检索已成为当前工业界和学术界的热点问题。跨模态检索是指,给定一种模态的查询样例,返回与查询样例语义相关的其它模态的样本,以帮助用户从海量的多媒体数据中检索出感兴趣的内容。跨模态检索的核心思想是精确地计算不同模态样本之间的相似度,这通常是由度量学习驱动的。跨模态检索方法的性能严重依赖于度量学习挖掘和加权样本对的能力。跨模态检索场景中不同模态间数据的异构性和模态间数据分布的不均衡性都为度量学习方法的设计提出新的挑战。首先,面对复杂多样的跨模态检索场景,急需开发一种与任务无关的通用度量学习方法设计准则,为设计新型的度量学习方法提供理论依据。其次,多媒体数据中包含的大量噪声,对度量学习算法在实际应用中的通用性和鲁棒性提出了很大的挑战。最后,传统的基于手工设计加权函数的度量学习方法不可避免的涉及到超参数,而超参数通常需要在验证集上进行精调,耗费大量的计算时间和资源。如何开发新的算法自动学习超参数是当前急需解决的难题。针对以上挑战,本文的主要工作和创新点可以总结如下:第一,针对缺乏通用度量学习方法设计准则的难题,本文在归纳总结已有加权损失函数的基础上,提出一种通用加权度量学习框架。该框架通过抽象的加权函数将相似度分数和权重值关联起来,并给出了加权函数满足的约束条件。该框架统一了已有的加权损失函数,为分析各种加权损失函数的可解释性提供了强有力的工具,同时为设计新型的加权损失函数提供了理论依据。此外,本文进行大量的实验,在跨模态场景下对已有的加权损失函数进行了综合评估。第二,针对跨模态检索领域缺乏通用、鲁棒度量学习方法等挑战,本文基于提出的通用加权度量学习框架,设计了一种新型的自相似度多项式损失函数。它提供了一个新型的多项式函数将样本对的权重值和自身的相似度分数关联起来,能在模型训练的同时自适应的为样本对分配合适的权重值。得益于多项式函数的通用逼近能力,所提出的损失函数可以拟合绝大多数的权重函数。自相似度多项式损失能普遍适用于现有的跨模态检索方法。在五个公共数据集上的实验表明,该损失函数能显著提升跨模态检索模型的收敛速度和检索性能。第三,基于提出的通用加权度量学习框架,本文设计了一种新型的相对相似度多项式损失函数。相对相似度多项式损失函数在保留自相似度多项式损失函数通用逼近能力的情况下,大幅减少了损失函数中的超参数数量,使得模型在实际应用场景中更容易找到最优的参数组合。相对相似度多项式损失函数能普遍与已有的跨模态检索方法结合,并显著提升其收敛速度和检索性能。在五个公共数据集上的实验表明,相对相似度多项式损失函数的性能优于自相似度多项式损失函数。第四,针对现有深度度量学习方法中超参数多,超参数设定困难等挑战。本文引入元学习机制,提出一种新型的元自步网络,它能在跨模态检索模型训练的同时,自动的从数据集中学习最优的加权机制。在四个公共数据集上的实验表明,元自步网络能普遍适用于多种跨模态场景,显著节省超参数精调时间,解决了跨模态度量学习方法中的超参数设定难题。
其他文献
由于三大不可再生的化石能源的日益枯竭以及能源利用过程中引发的环境问题,因此急需开发可再生能源作为替代。生物质作为一种产量丰富,分布广泛的碳中性资源得到了社会的广泛关注。生物质中主要的三大组分是纤维素、半纤维素和木质素,其中纤维素是由葡萄糖通过糖苷键连接而成的线性分子,半纤维素通过五碳糖和六碳糖连接而成,它们的结构都已明确并得到了很好的应用;而木质素是一种三维网状大分子结构,由于其结构复杂,导致其应
部分学生一提到英语作文就感到"一个头两个大",但其实,只要学生掌握了充足的词汇,审题得当,并且能够抓住技巧、运用技巧,要写出一篇合格的文章并不困难。基于此,在教学中,教师可以着力向学生分析和讲解初中英语写作的若干技巧。
目前,我国的经济发展方式、发展阶段已经实质上发生了变化,促进经济增长主要是依靠科技的进步、工人综合能力的提升、管理措施上的创新,正式步入了重视发展质量的阶段,建筑行业也不例外。本文主要通过分析建筑行业里的龙头企业(A企业)在发展过程中自身特点以及遇到的发展瓶颈,探讨建筑企业内部审计的特点、存在问题,以及如何使内部审计在体制、员工和信息建设等方面发挥促进作用,通过本文的研究旨在帮助建筑企业完善内部审
随着国内粘胶纤维、纤维素纤维消费需求的增长和国内原料资源的限制,传统的木浆粕、麻浆粕、棉浆粕已经无法满足纤维素纤维用浆粕行业的市场需求。从废弃农林作物中寻找资源来缓解纤维素浆粕原料紧缺问题是一种切实可行的办法。香榧壳作为常见的一种废弃农林作物,长期以来被当作废弃资源,没有得到一定的加工应用,无法实现资源的循环利用,并且丢弃的香榧壳对环境也造成了一定的污染。若能将香榧壳资源采用一定的技术手段去开发利
《诗经》中爱情诗占比很大,而弃妇诗是爱情诗的重要组成部分,塑造了中国文学史上第一批弃妇形象,具有独特的文学价值和社会意义,因此也是中国文学中不可忽视的重要领域。诗中描述的弃妇形象生动鲜明,各有特点。本文运用对比等手法,以《邶风·谷风》和《卫风·氓》为个例分析弃妇形象的共性和具体特征,反映其在相似人生经历下的不同性格特点,进一步探究其共同悲剧命运的必然性。
班级管理主要指根据一定的要求,带领学生对班级中的各项活动进行合理调控,从而实现最终教育目标的过程。在素质教育深化实施的背景下,班级管理更加关注学生的全面发展。基于此,传统的班级管理模式已经逐渐凸显出缺陷。因此,在新时期的小学班级管理活动中,班主任应该对具体的育人要求有更加准确的把握,并以此为基础实施更具针对性的班级管理措施。这样一来,有利于逐步促进班级管理过程的优化,从而使班级管理活动的质量得到有
<正>随着新课程改革的深入进行,许多小学数学教师的教学行为和学生的学习方式都发生了较大的变化,在课堂教学过程中出现了以往教学过程中不常应用的动手操作、小组合作、讨论交流、自主学习等丰富多样的教学方式。自主学习作为一种数学学习方式,是让学生在亲身经历、亲
期刊
<正> 我们采用五皮饮加玉米须治疗妊娠水肿43例,效果较好。桑白皮五钱,茯苓皮三钱,大腹皮四钱,陈皮三钱,生姜皮二钱,玉米须(干)一两或鲜品二两。每日1剂。上药加水500毫升,煎至200毫升成为头煎倾出,
期刊
抗日战争时期,孙中山因其特殊的历史地位是国共两党共同认可的政治人物,成为具有强大号召力和凝聚力的象征符号,是国统区和根据地历史教科书书写的重要内容。由于国共两党阶级属性和政治理念的分歧,国统区和根据地的历史教科书所构建的孙中山形象也有所不同,主要表现在:叙述孙中山革命活动,存在“民族救星”与“主要领导者”的表述差异;阐释三民主义,存在全国民众的“精神导师”与民族抗战“旗帜”的书写差异;评价孙中山行
随着新课程改革的不断推进,小学班级管理的理念及模式也得到了很大的发展,有效提高了小学班级管理的水平。而激励策略是小学班级管理中常用的一种管理方式,不仅能有效满足学生的个性化发展需求,更能调动学生的自主管理意识,帮助树立自信心,有助于在班级管理过程中营造一种积极向上的班级环境。因此,班主任在小学班级管理中积极运用激励理念,以此实现小学班级管理效率的提升。