【摘 要】
:
图像检索是指将待查询图像与候选图像进行相似度比较,找出与查询图像相似或相关的图像。随着图像数据的海量增长和深度学习的快速发展,基于内容的图像检索吸引了越来越多的研究者。一方面,该课题对计算机视觉领域的其他任务(如行人重识别、图像分类等)有积极的促进作用,另一方面,该课题在实际应用中(如电商平台通过图像查询商品,安防等)也发挥了重要的作用。近年来,基于深度学习的图像检索方法取得了良好的效果。然而,图
论文部分内容阅读
图像检索是指将待查询图像与候选图像进行相似度比较,找出与查询图像相似或相关的图像。随着图像数据的海量增长和深度学习的快速发展,基于内容的图像检索吸引了越来越多的研究者。一方面,该课题对计算机视觉领域的其他任务(如行人重识别、图像分类等)有积极的促进作用,另一方面,该课题在实际应用中(如电商平台通过图像查询商品,安防等)也发挥了重要的作用。近年来,基于深度学习的图像检索方法取得了良好的效果。然而,图像检索任务仍然面临一些问题,如图像中存在干扰信息和图像特征维度过高等。针对以上问题,本文提出了基于注意力机制的特征加权方法和基于多向主成分分析的特征降维方法。同时,本文通过充分的实验验证了这些方法的有效性。本文的内容总结如下:(1)提出基于注意力机制的图像检索方法。因为图像中不可避免地包含一些干扰物体,所以使用卷积网络会将这些干扰信息编码进图像的全局描述符,进而影响检索准确率。为了减少这些干扰信息的影响,我们设计了基于注意力机制的特征加权模块,为图像生成具有辨识度的全局特征。该模块包含两个部分,第一部分作用于空间维度,首先评估区域特征的重要性,为每一个区域特征生成对应的分数,随后剔除那些得分较低的特征并为保留下的特征重新赋予权重。第二部分作用于通道维度,通过调整特征图的权重分布,使提取的特征更具辨识度。此外,我们还在测试阶段使用多尺度的特征,使得检索准确率进一步提高。我们在经典的图像检索数据集上进行了实验,结果表明本文提出的方法可以有效提高检索准确度。(2)提出基于多向主成分分析的图像检索方法。我们通常将图像通过卷积网络生成的特征图看作局部特征的集合。直接级联局部特征作为图像的描述符存在明显的不足。一方面,直接拼接后的描述符维度过高,对计算机的运算能力和内存容量都提出了较高的要求。另一方面,张量数据本身包含一定的结构信息,直接拼接将破坏这些信息。针对上述问题,本文提出了可微分的多向主成分分析模块。在该模块中,我们首先利用图像的特征图(Feature Maps)得到固定尺寸的区域特征,接着区域特征通过MPCA(Multilinear Principal Component Analysis)层进行降维得到图像的全局描述符。该模块直接作用于张量数据,通过矩阵投影的方式将原始张量数据从高维空间映射到低维空间,避免了张量数据拼接造成的结构信息破坏。不同于传统的MPCA,该模块被设计为可微分的,可以嵌入现有的卷积网络。因此,该模块能够利用图像的标注信息聚集相同类别的数据,分隔不同类别的数据。我们在相关数据集上进行实验,验证了该方法的有效性。
其他文献
基于我国城市土地资源越来越紧缺的发展趋势,国内高校的开发强度逐步提高。高密度校园中也开始出现以空中步廊系统设计为导向的校园规划策略。但由于高校空中步廊系统设计理论尚不成熟,大部分高校的空中步廊系统不成体系,使用率较低,大多未达到设计预期。香港与深圳作为国内典型的高密度城市,在高密度校园的空中步廊建设上具有一定的实践经验。本文通过对深港两地现有高密度校园的空中步廊系统进行调研分析,将筛选的重点案例按
纤细裸藻(Euglena gracilis)富含副淀粉,是一种新型的保健食品。副淀粉具有降低胆固醇、降低血糖、抗病原微生物、抗肿瘤、保护肝脏和免疫调节等多种生物活性,有望开发成营养保健品或免疫佐剂。然而副淀粉的免疫调节机制尚未明确,极大地制约了副淀粉的开发应用。本论文以超声和碱化的方法制备裸藻副淀粉,探究其对RAW264.7巨噬细胞的免疫激活效果及机制,主要内容及结构如下:(1)优化了裸藻副淀粉的
拓展金融科技应用,应当树立以人民为中心的发展理念,坚持以人为本,不能本末倒置,舍本逐末。要注重用户体验,体现人文关怀,营造友好、安全的服务环境。同时,金融科技本质上是一种技术驱动的金融创新活动。无论叫金融科技还是科技金融,始终不能忘记金融属性,不能违背金融运行的基本规律,否则必然会受到市场的惩罚。
首先以盐酸分解磷矿制备酸解液,再通过向酸解液中加入硫酸制备硫酸钙晶须。实验考察了加料时间、搅拌转速、硫酸浓度、硫酸根与钙离子物质的量比、氧化钙质量分数、反应温度对硫酸钙形貌及晶须长径比的影响。采用扫描电镜观察硫酸钙形貌并用Image-Pro-Plus对硫酸钙SEM图进行分析得到硫酸钙晶须的平均长径比。实验得到硫酸钙晶须的最佳制备工艺条件是:加料时间为20 min、搅拌转速为350 r/min、硫酸
全景视频作为一种新颖的视频格式受到了人们的广泛关注,而虚拟现实游戏的热潮进一步促进了全景视频的发展。全景视频提供观看者沉浸的视频体验,视频的内容呈现于立体球面。本文主要研究全景视频视口预测和全景视频人物检测两方面内容。全景视频的视口预测具有重要的研究意义。在传统的视频传输过程中,视频服务器发送完整的视频数据到接收端。然而,观看者仅对视口内的图像可见,视口外的视频内容浪费了大量的传输带宽。因此,视口
现如今随着科技的不断发展,在社会的发展历程中,数据扮演越来越重要的角色。海量数据的利用对于生活或者商业中构建合适的模型来预测特定的任务有很大的优势。所以,在社会实践应用中大数据无处不在,如生物医学领域的疾病数据,计算机视觉领域的图像数据,自然语言处理的文本数据的使用等。为了能够更好的挖掘数据潜在的价值,挖掘数据的技术成为了近段时间来的研究热点,如:聚类和推荐算法等。在机器学习和数据挖掘中,聚类是很
在低光照环境下,由于普通消费者拍摄的照片通常会受到相机抖动、传感器噪声等因素的影响,从而导致所获取到的照片质量不佳。经过图像增强处理后,能够使获取到的图片质量得到一定的改善,以达到与人们主观审美感受相一致的结果。虽然目前有一些图像质量评估指标,能够对经过图像增强处理后的照片进行质量评价,但是,这些评价指标没有经过人们的主观验证,不能仅凭此判定经过图像增强处理后的照片就一定符合人们的主观审美。针对该
近年来,物联网(Internet of Things,IoT)已经成为一个重要的研究领域。其中,智能空间结合了环境感知和机器学习,以智能方式向用户提供智能和定制服务。随着传感和通信技术的进步,物联网使得用户可以随时随地与任何事物进行连接,也由此产生了更多的用户服务。因此,实现准确、非侵入式和安全的智能交互成为了研究热点。如今,居住在智慧城市的人们的方方面面都与物联网息息相关,正因为如此,身份识别服
随着工业的快速发展,人们对产品的质量要求也越来越关注。产品表面缺陷检测作为生产过程中最重要的工序之一,它直接影响到产品质量以及用户体验。产品在生产过程中往往会出现一些缺陷,这些缺陷具有一定的随机性,缺陷类型、形状大小各异。传统的人工检测虽然方法简单,有些缺陷的特征不够明显,利用人眼难以识别,检测误差较大,并且效率低下;现有的机器视觉方法能够实现自动检测,但其核心算法需要人工提取特征,存在选取特征不