基于区域评价和关系建模的图像检索研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户：www_073

【摘要】

：

基于内容的图像检索(CBIR),俗称“以图搜图”,一直以来都是计算机视觉领域的基础研究课题,其对相关研究领域有着深远的影响,并有着广泛的商业应用。随着网络上的多媒体数据呈

【作者】

：

王炯

【出处】

：

深圳大学

【发表日期】

：

2019年01期

【关键词】

：

图像检索视觉识别区域特征注意力机制视觉关系推理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于内容的图像检索(CBIR),俗称“以图搜图”,一直以来都是计算机视觉领域的基础研究课题,其对相关研究领域有着深远的影响,并有着广泛的商业应用。随着网络上的多媒体数据呈现爆炸式地增长以及自动驾驶,增强现实等越来越多实际应用的需求,图像检索成为一个基础且具有实际意义的研究课题。近年来,深度学习方法和理论在人工智能,模式识别的代表性研究方向如物体识别,语音识别,物体检测等任务取得了巨大成功。图像检索领域也毫无例外地将传统方法与深度卷积神经网络(CNN)特征相结合,进行编码和聚合得到紧凑的全局描述符表示。CNN特征具有表示能力强,维度低等优点,逐渐在工业界和学术界被广泛应用。本篇论文的研究工作主要在两类图像检索数据集展开:标准物体检索数据集和地理位置检索数据集。两种数据集可以进一步划分为单物体图像检索和多物体图像检索数据集。虽然近年的工作将这些数据集的检索准确度提升到了很高的层次,现今的方法仍存在一些待改进的地方。本文也通过改进现有的方法进一步提升了图像检索准确度。本文的研究工作主要包括:(1)有效解决过度计数问题。自然图像中的物体或多或少具有重复结构,尤其在建筑物上最为常见。之前的一些工作分析这种重复结构会造成该结构特征的过度计数问题,从而影响图像之间的相似性度量。借助于CNN的空间结构,我们使用金字塔池化来聚合CNN的特征图得到区域特征,金字塔池化中使用区域最大池化可以有效地避免局部结构的过度计数问题。同时在实验中,我们发现图像检索中常用的PCA(主成分分析)白化过度地惩罚了全局描述符的过度计数问题,因此我们提出PCA幂白化,通过设置方差缩放因子以合理地解决过度计数问题。(2)通过区域评价解决背景以及干扰物体的影响。在图像检索数据集中感兴趣区域(ROI)通常只占图像的一部分,而广泛存在的背景和干扰区域在检索时会影响图像的相似性度量。借助在自然语言处理领域流行的注意力机制,我们提出两种注意力模块,注意力模块可以评价每一个区域特征并产生相应的权重,自适应地给ROI分配大的权重,背景和干扰区域小的权重以减少其对图像相似性的贡献。通过实验验证我们发现注意力模块可以有效提升区域特征和局部特征的辨别能力。(3)使用关系特征进行图像检索。过去的工作中,几乎所有基于CNN全局描述符的图像检索方法基于这样一个假设:如果两幅图像具有足够多相似的物体,则两幅图像匹配。物体之间的关系在这些假设中被忽略了,而物体之间的关系对于匹配两张图像是很重要的信息。基于图像检索领域流行的区域特征,并借鉴在视觉关系检测,视觉问答等视觉推理任务中广泛使用的关系建模框架,我们提出了一种区域关系模块,该模块通过对区域特征的关系建模可以产生关系特征,进而组成关系特征图。关系特征图相比于传统CNN特征图,具有更高层的包含物体外观和物体间关系的信息,结合常用的聚合方法后表现通常更优。同时通过分析关系特征图的空间结构,我们进一步提出一种新的级联池化方法,极大地提升了检索准确度。

其他文献

氮化碳材料的光致发光性能研究

荧光材料具有将所吸收的光能再次以辐射形式发射出体外的特性,在显示和通讯等领域有着重要应用。氮化碳材料是一种适于制备纳米结构的无机材料,可以形成纳米薄层结构。氮化碳

学位

氮化碳纳米材料光致发光猝灭现象

面向高传热效率的换热器结构设计

换热器是诸多工业领域中不可或缺的重要设备,作用是为石油、化工、制药等企业生产线进行供热及控温,从而提高产品的生产效率和质量水平。本文将对广受应用的螺旋折流板换热器

学位

传热学螺旋折流板数值模拟尺寸优化

基于表面肌电信号的驾驶员上肢神经肌肉力学特性研究

转向系统是人-车触觉交互的主要媒介之一。驾驶员转向操纵的执行器是上肢的神经肌肉,驾驶员上肢肌肉发力特性的定量研究对转向舒适性的评价、智能汽车拟人化驾驶、人机共驾汽

学位

神经肌肉力学表面肌电信号最小二乘法参数辨识牵张反射

核级316NG奥氏体不锈钢在长时间热老化条件下的析出相研究

反应堆冷却剂主管道在核反应堆环境下长时期服役及核电辐射过程中会有碳氮化合物以及金属间化合物等相的析出,导致管道材料逐渐热老化,大幅降低其使用年限,并造成主管道的破

学位

316NG奥氏体不锈钢析出相热老化电解萃取CALPHAD

掉层框架剪力墙结构地震易损性研究

具有不等高接地特征的掉层框架剪力墙结构是山地建筑结构的一个重要类型,在山地城镇建设中应用广泛。结构不等高接地导致结构布置不连续,在上接地层存在刚度和质量突变,使得

学位

掉层框架剪力墙结构增量动力分析地震易损性分析抗震性能

基于数学文化融入家庭教育的研究

家庭教育是当前三大教育中的支柱,同时也是教育工作开展的重要根基。为更好地满足孩子的学习需要、促进孩子文化素养和综合素质的提升,以及提升孩子的问题解决能力,特别是在

会议

数学文化文化知识家庭教育

基于全波形反演的微震事件定位和速度建模

全波形反演(Full-Waveform Inversion-FWI)技术通过利用地震波的波形信息重建地下参数,包括纵、横波速度,密度及各向异性参数。最近的综合研究表明,该技术有可能为微地震数据

学位

全波形反演伴随状态法微地震微地震定位

超静孔隙水压下海相沉积软土卸荷蠕变特性及本构模型研究

海相沉积软土广泛地分布在我国珠三角、长三角等沿海地区,是我国人口最集中、经济最发达的地区。随着以上地区城市建设的快速发展,大量的软土地下空间被开发,如:地铁盾构隧道

学位

超静孔隙水压软土卸荷蠕变本构模型

基于Huber-MRF约束的时间高阶差分精度全波形反演研究

全波形反演理论能够充分利用叠前资料的所包含的地震波场的运动学及动力学信息,进行高精度成像和精确地震反演时具有较大的潜力。随着油气勘探对勘探分辨率的要求逐渐增高,全

学位

马尔科夫随机场时间高阶全变分Huber-MRF约束

基于BIM技术的异型结构桥梁施工管理研究

随着科学技术的发展,建筑行业的新技术使用也在不断更新,BIM技术的应用是我国建筑行业发展的重要方向,桥梁是一种特殊的建筑,也面临着BIM新技术使用带来的机遇和挑战,只有不

学位

BIM设计计算复核碰撞检查异性墩柱施工弧形箱梁施工

基于区域评价和关系建模的图像检索研究

其他学术论文