基于深度语义挖掘的零样本草图检索

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:edu009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图像内容在互联网上的爆炸式增长,如何在大规模图像数据中快速检索出用户所需的图像已经成为人们关注的重点。传统的图像检索依赖用户提供文本描述,然而在训练检索模型时,获得文本描述需要花费大量的人力物力。近年来,随着移动智能设备的发展,人们可以在移动智能设备上快速绘画出能简单,清晰地描述物体特征的草图。因此,基于手绘草图的图像检索,这种不需要提供文本描述的检索方式引起了广泛的研究。此外,要保证所有物体类别都在训练过程中出现是很困难的。因此,基于零样本草图的图像检索这个更实际,更具挑战的难题出现了。基于零样本草图的图像检索涉及两个难点:一是如何克服跨模态检索中的语义鸿沟,二是如何构建零样本学习中可见类与未见类的联系。而解决这两个问题的关键都在于如何挖掘图像和草图的语义信息。因此,本文的研究重点是如何深入挖掘语义信息,使得生成的检索特征包含更多有效的语义信息。本文主要工作如下:1.为了保证模型在学习过程中能挖掘出两个模态共有的语义信息,本文提出了一种基于语义交叉模态重建的零样本草图检索方法。首先,本文采用两种常见的词嵌入模型来提取词向量,并将其作为语义监督。为了保证检索特征能够保持语义信息的完整性,本文采用了渐进式的生成策略,即第一步将两个模态的视觉特征分别映射到语义空间上与词向量对齐得到语义特征,第二步再将语义特征映射到共同的低维检索空间。在生成语义特征的过程中,本文采用了生成对抗的思想,即将词向量作为真实样本来约束生成的语义特征尽可能地学习到词向量的分布。此外,本文为了进一步挖掘语义信息,提出了语义交叉模态重建损失。它要求两个模态生成的语义特征都能够重建回原始的草图视觉特征和图像视觉特征。通过在两个常用的草图数据集Sketchy和TU-Berlin上进行的实验证明了该方法的有效性。2.为了保证模型生成的检索特征具有更加完整纯净的语义信息,本文提出了一种基于视觉特征分解的零样本草图检索方法。由于视觉特征中含有语义信息和域信息,而域信息对检索是有干扰的。因此,为了挖掘更完整纯净的语义信息,本文采用了视觉特征分解模块,将视觉特征最终分解成只包含语义信息的检索特征和只包含域信息的域特征。其中,检索特征的生成也是渐进式的。此外,本文为了进一步挖掘完整纯净的语义信息,提出了交叉组合重建损失。它要求分解后的检索特征和域特征能够根据不同的组合重建回原始的草图视觉特征和图像视觉特征。通过在两个常用的草图数据集Sketchy和TU-Berlin上进行的实验证明了该方法的有效性。
其他文献
威海市文登区位于山东半岛东部,因为便利的海上运输以及丰富的海洋以及旅游等资源,近年来得到了快速的发展。在经济高速发展的同时,土地利用发生了快速的变化,通过分析文登区的土地利用空间分布情况可更加清楚的了解研究区的土地资源分配情况,不仅能够对土地资源规划管理提供基础性研究数据,而且对于推动城市化建设及经济发展具有重要意义。在土地利用变化研究中通常采用遥感技术手段实现,正因其光谱数据信息丰富、时效性高、
近年来,建筑业发展不断攀升,规模不断扩大,结构日趋优化,行业也越来越正规化。但由于项目成本不断上升,利润稀薄,使得中小企业不堪重负,以至于在建筑市场的生存空间越来越狭小。中小企业若想在行业竞争中立足,加强成本预算控制成为一种提高企业经济效益的重要手段。本论文以晶科A厂一期项目为研究对象,运用相关基础理论,结合案例分析法、问卷调查法和深度访谈法,发现该施工项目在各个环节中存在的问题并剖析存在问题的原
随着生活水平的提高,人们的健康意识明显增强,在食材的选取方面也更加重视。如何提高甘薯的质量也就成为当今农业生产的一大研究热点,因此在将甘薯投入到市场之前,对其进行有效的检测分级就成为农业市场必不可少的一道重要工序,既可以保证甘薯的品质,提高经济价值,也为甘薯的市场经营管理提供了便利。针对目前较为常用的生物化学检测方法和人工分级技术,不仅效率低下,精度不稳定,耗时较长,且对农产品破坏性较高的问题,本
我国海域辽阔,港口众多,海产资源丰富,渔业一直是我国的重要产业。随着我国渔业和物联网技术的发展,我们需要发展更新现有的渔用通信设备,来满足日益增长的海上通信需求。Ad hoc网络具有无中心、自组织等特性,可以在不依赖固定网络设备的情况下快速搭建,适应网络拓扑的动态变化。这与渔业通信的需求相契合,因此可以将Ad hoc网络应用于海洋通信系统中,来更新落后的渔业通信设备。本文首先介绍了Ad hoc网络
职业倦怠研究过去主要是集中在教师、银行职员、医生等高压群体,近年来针对公务员群体的职业倦怠研究逐渐出现在人们视野,尤其是针对基层公务员的研究越来越多,公务员群体出现职业倦怠会影响工作效率,导致落实政策效率下降,同时造成人才流失严重。2019年是全国基层公务员减负年,如何减轻基层公务员的负担,提高基层工作热情,目前尚缺乏具体有效对策。2018年国家税务总局在省级以下原地方税务局和国家税务局进行了机构
医保支付方式是调节医疗服务行为、引导医疗资源配置的重要杠杆。近年来,在医疗费用持续上涨、医保基金压力不断增大的现实背景下,医保支付方式改革越发引起广泛重视,国家相继出台了一系列的政策文件要求推进医保总额控制以及按病种付费的执行落实。因此,分析总额控制下按病种付费的实施效果,为完善支付方式改革提供建议具有较好的研究价值与实际意义。本文在阐释医保支付方式、按病种付费等概念及相关理论的基础上,介绍江苏省
制造业是实体经济的核心支柱,为国民经济各个领域的发展提供了坚实的物质基础。从国家到地方再到基层都高度重视大力发展先进制造业,推动制造业转型发展上下已形成共识成为国家战略。各级政府推动工业转型升级的政策密集出台,政策支持力度也不断加码,成为各级政府公共政策中的重中之重。W市素以工业立市,改革开放以来形成了门类较全的制造业体系,工业基础良好,有利于工业转型升级政策发挥应有效能,当地良好的营商环境也为工
石墨炔是一种由sp和sp2杂化碳原子所构成的新型二维碳材料,具有与石墨烯类似的π-π共轭结构。理论预测石墨炔具有卓越的力学、电学、热学和光学性能,已在光/电催化、能源存
在光源的一定变化范围内,人眼对场景内物体的表面颜色具有感知不变性的能力。这种消除光源颜色使人眼能够准确看到物体表面实际颜色的知觉特性称为颜色恒常性。尽管人眼视觉系统能够轻松识别处于未知光源下的物体并实现其表面颜色的恢复,但计算机却并不具有人眼视觉系统的颜色恒常特性。在计算机视觉领域中,稳定的颜色特征是很多计算机视觉任务的基础条件,因此许多学者致力于研究颜色恒常性计算问题,以使得计算机也能够稳定的观
随着无线和移动通信产业的快速发展和5G时代的来临,射频前端应该满足小型化、多功能等要求。滤波器与天线原本是作为两个独立的元件存在,几年来由于通信系统对前端系统小型化和高集成度的需求,两者的一体化研究与设计越来越多。现阶段滤波天线的设计方案主要分为两大类,一类是滤波器与天线的联合设计方案,另一类是滤波器与天线的融合设计方案。前者是以滤波器设计为主,将天线与滤波器直接级联或者使其作为滤波器的最后一级工