语义感知顺序敏感的深度哈希图像检索研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhiqi_xu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索具有重要的应用价值和研究意义,但也面临检索速度提升、结果排序准确性等诸多现实挑战。哈希技术通过将高维特征映射到低维二值空间,可有效加快距离计算,是目前提升检索速度的重要手段。此外,深度学习能够在一定程度上缓解图像底层视觉信息与高层语义信息之间的“语义鸿沟”。因此,将深度学习和哈希方法结合应用于图像检索具有重要的研究价值和意义。
  本文研究基于深度学习和哈希技术的多标签图像检索,针对目前多标签检索领域存在的3个研究难题,分别对其进行深入研究并提出相应解决策略。本文创新点和主要内容如下:
  ①针对多标签图像间相似性量化方法语义表达能力不足的问题,本文提出了新的融合类别和语义信息的量化方法。区别于仅考虑类别层次相似性的方法,本文基于自然语言处理技术,将图像对应的文本描述进行语义编码后,作为辅助信息注入到量化方法中,以捕捉类别之外的高层语义信息,提高量化方法的语义表达能力。
  ②针对常规二元损失函数对相似图片的相对顺序不敏感问题,本文构建了可随相似度矩阵自适应变化的上、下界阈值函数,并引入到二元损失度量中,以在汉明空间构造紧致的零损失距离区间,实现对相似图片间距离的直接紧致约束。该约束表现出的物理意义是:鼓励相似度更高的图片在检索结果中排序更靠前。
  ③针对训练过程中的“数据不平衡”问题,本文根据每一训练批次中正负图片对的数量,为二元损失函数添加自适应权重系数,自适应调整正负二元组对于总损失的贡献率,减少训练过程中数据集分布不均匀带来的影响。
  ④综合上述3点,本文提出语义感知顺序敏感的深度哈希方法DSRPH(Deep Semantic-aware Ranking Preserving Hashing),构建了多标签图像检索神经网络框架。DSRPH对高层语义信息具有更强的感知能力,并能根据多级别相似性生成更准确的检索结果排序。通过在MS COCO、NUS-WIDE及Flickr三个多标签图像公开数据集上的多角度实验评估,验证了DSRPH的有效性,以及相对于IDHN、HashNet、DHN、DSH、ITQ和SH六种代表性优秀哈希算法在检索性能上的优越性。
其他文献
现实网络之间存在相互作用,单层网络的研究已经不能满足实际需要。最近几年,国际上提出了多层网络的概念。多层网络能更好地描述实际网络之间的相互作用。同步是现实网络中普遍存在的现象。多层网络的同步研究具有十分重要的意义,正吸引着不同领域研究者的关注。由于实际网络往往包含大量节点,且拓扑结构复杂,牵制控制实现多层网络的同步更加实际和经济。
  以往的牵制控制研究大多都是基于单层复杂网络,本论文基于无向连接的两层网络,研究了牵制控制下的多层网络的层内同步问题,其中第一层的节点和第二层的节点一一对应无向连接,每
突发灾难发生后,受灾区域的一些基础服务设施,例如道路、医院等,可能会遭受严重破坏。由于突发灾难下伤员数量激增,远远超出现存医疗设施的承受能力,大量伤员无法入院治疗,可能导致伤员死亡率增加甚至造成现有医疗服务系统瘫痪。因此,突发灾难下迅速的应急医疗响应决策对提高伤员存活率具有重要的意义。
  针对突发灾难下应急救援工作,以灾后应急医疗设施选址与分配问题作为研究主体,在现存医院的基础上选择要新建的临时应急医疗设施的位置、将有限数量的救护车分配至应急医疗设施以及将受灾点伤员分配至应急医疗设施进行统一决策,
语义分割旨在对图片所有像素点进行类别标记,随着深度学习与高精标记数据集的快速发展,该视觉任务取得了重大进展。然而,繁琐耗时的人工标记成本极大限制了样本数量与识别类别种类,阻碍了语义分割的实际应用。因此,近几年基于弱监督的语义分割得到了广泛关注。给定图片级别的类别标签(即只标明图片含有的类别),CAM(类别响应图,ClassActivationMaps)常用于初始图片分割(也称初始种子),其分割区域通常集中于小且稀疏的显著判别域,而非完整的物体对象。为了提升分割性能,本文着眼于初始种子的区域扩张。
 
频发的自然灾害对人类社会造成了巨大的损失。随着人类社会的快速发展,人们在抗灾救灾方面的意识也越来越强烈,关于应急管理的政策和研究也受到了广泛的关注。面对难以预测的自然灾害,最高效的应急管理措施就是灾后快速地展开救援活动。而灾后救援活动的首要任务就是为灾民提供安全的应急避难场所和生存所需的资源。因此,立足于自然灾害背景,对灾后应急避难场所选址与资源分配问题进行探索研究具有重要的现实意义。
  基于自然灾害下应急避难场所选址与资源分配问题的特性,针对现有研究的不足,提出了根据灾民的受伤程度将灾民划分为不
滑坡灾害是一种极具破坏性的地质灾害,严重威胁人们的生命财产安全,造成全球生态环境的破坏和资源的浪费。因此,深入对滑坡预测及其控制系统的研究对降低滑坡灾害的影响具有重要意义。
  滑坡演变过程受多种因素影响,具有很强的非线性和不确定性。人工神经网络可以避开复杂的机理分析,建立系统的黑箱模型。本文以三峡库区白水河和石榴树包滑坡为研究对象,将神经网络引入滑坡的预测和控制系统研究中。首先,采用Elman动态神经网络建立滑坡单步预测模型,利用滑坡时间序列数据特点改进BP算法,降低模型训练的时间复杂度,以较高的
传统巴甫洛夫联想记忆实现的学习和遗忘功能,分别对应于经典条件反射中的强化和消退定律。实际上,经典条件反射除了强化和消退定律外,还包含了泛化和分化定律。在传统的巴甫洛夫联想记忆基础之上加入泛化和分化功能,可以更加充分的模拟大脑的联想记忆过程,为类脑系统的进一步发展提供参考。
  本文设计了基于忆阻的联想记忆泛化和分化电路,电路经过最初的联想记忆学习之后可以对某种条件刺激做出反应,然而当相似的条件刺激作用于电路时,电路会做出类似的响应,这就是泛化现象。为了使神经网络电路能够充分的认知这两种相似的刺激并最
由于数字图像数量的快速增长,基于内容的图像检索已成为管理图像数据库的强大工具。但是,随着图像数据库的扩大,图像检索系统对存储和计算资源的需求随之增加。幸运的是,随着云计算的繁荣,中小型企业开始在云平台上构建和维护大型、经济、高效的图像检索系统。尽管云平台提供了便捷的存储、计算和通信服务,但它们带来了新的隐私问题。在加密图像上进行检索是一种保护用户隐私的技术,并且在过去十年中学者们已经进行了广泛的研究。尽管一些方案已经被提出并可以在一定程度上保护用户隐私,但是它们仍然具有一些缺点。首先,在实践中,仅图像的部
近年来,大学生心理健康日益成为高等学校乃至全社会关注的一个问题。在具有心理健康问题的大学生群体中,学校特别关心大学生心理危机个体,即有较高风险罹患心理疾病的大学生个体。这类学生可能会出现严重心理障碍,或者因为心理问题实施自残、伤人甚至自杀行为,从而严重影响学生的学习、生活和人身安全。
  心理量表是目前普遍使用的心理健康检测工具,然而直接使用量表的传统计算方法识别心理危机个体存在许多不足,导致较高的假阳率和假阴率。本文提出了一种基于图神经网络的心理危机个体识别方法,以弥补传统识别方法的不足。本文的主
近年来,移动互联网、边缘计算、物联网等技术的发展和成熟催生了大量新的移动设备和移动应用,如有健康监测功能的可穿戴设备、移动电子商务、网络手游、短视频等。这些新兴的移动应用有着更高的数据存取需求和更大的计算量,同时表现出新的数据存取模式和数据分布特征。小文件随机读写操作占到这类移动应用中数据存取的很大部分,这种大量的细粒度存储需求导致基于块设备建立的移动设备存储系统不足以满足这类应用的存储需求。研究表明,移动设备性能瓶颈由原来的网络和处理器已转为现在的存取能力。新兴的非易失性内存(NVM)具有可字节寻址、高
随着数字图像技术的发展和多媒体应用的普及,图像处理和传输变得越来越重要。人们对图像的传输和存储有了更高的要求,对图像的质量要求也逐渐提高,例如远程医疗、航空航天、多媒体教学和视频安防等领域。图像压缩编码在图像处理中起着至关重要的作用,此对图像压缩的相关技术和科研工作带来了全新的挑战。几乎所有多媒体应用都追求具有更高压缩率,更低计算成本和更好视觉质量的图像压缩技术,这也是图像压缩的三个关键指标。
  JPEG-XR(旧称HD Photo)是一种连续色调静止图像压缩算法,是在2007年由联合图像专家小组