基于NetVLAD的场景识别算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:waterlee1999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
场景识别是在一直以来都是计算机视觉领域的一个重要研究方向,因为场景识别拥有很高的应用价值,在车载辅助导航、地理信息定位和视频图片理解方面都需要场景识别算法作为支撑。随着汽车自动驾驶系统的兴起,场景识别在自动驾驶系统中更是起到了不可或缺的作用。随着深度学习在计算机视觉领域的崛起,基于深度学习的场景识别也层出不穷,本文选取了NetVLAD方法作为研究基础。本文从以下三个方面展开对基于NetVLAD的场景识别方法的研究。第一,针对场景图片中存在的许多视觉混淆元素,例如车辆,树木等次要视觉信息,提出了基于注意力机制的NetVLAD网络,通过注意力机制关注重点区域提升场景识别精度,针对场景识别任务要求以及NetVLAD的特点,提出了一种融合多尺度特征的注意力模块,加入了对于尺度信息和特征信息的选择,分别在谷歌街景数据集和主流场景识别数据集上进行实验,并通过对比试验论证了基于注意力机制的NetVLAD算法的有效性,探究了注意力模块与NetVLAD的不同组合方式对网络的影响,证明了多尺度注意力模块对于网络性能的提升,细致分析了场景识别的结果,并可视化不同NetVLAD网络模型的注意力区域,增强了网络的可解释性。最后证明了基于注意力机制的NetVLAD模型在场景识别任务上具有一定的通用性。第二,本文针对谷歌街数据集提出一种弱监督训练方法,谷歌街景数据集中的GPS坐标是一种弱标签,由于弱标签的语义信息不足以完全作为判断场景相似度的依据,需要补充先验信息以获得较为准确的标签,所以本文采用传统场景识别算法结合深度特征提供先验信息,增加了正样本的多样性,实验证明优于只使用深度特征的方法。第三.本文针对传统的三元组损失函数进行改进,增加了相似样本对距离的约束项。传统的三元组损失只关注正负样本之间的距离,而忽视了正样本对之间的距离,实验证明使用改进的三元组损失函数可以加快网络收敛速度并提高场景识别精度。
其他文献
随着微电子行业的快速发展,电子产品不断地向着小型化、高集成度、多功能、低成本的方向迈进。传统的方式是通过减小器件的特征尺寸,从而降低功耗、增加集成度,而三维集成技术通过让芯片在垂直方向的堆叠,进而解决了传统微电子工艺逐渐接近物理极限的问题,国外对该技术有着广泛的研究。多层芯片键合是三维集成技术的关键之一,不同层的硅片通过键合实现结构和电学上的互连。本文围绕三维集成技术中的多层芯片键合工艺,以及键合
随着人工智能、智慧医疗、无人驾驶等技术的兴起和发展,对特定目标距离和位移的精确测量在实际的工业生产中发挥着重要作用。传统的测距方式普遍存在精度不高、易受环境影响等问题,因此多种“非接触式”的测距方式应运而生。其中FMCW(Frequency Modulated Continuous Wave)雷达测距系统因其测量精度高、不易受环境干扰的特点体现出了很好的应用前景。本文调研和分析了当前国内外对FMC
学位
VDAC(Voltage-dependent anion channel)是线粒体外膜上的主要离子通道,参与细胞质和线粒体膜间物质、能量交换,在细胞程序性死亡、物质运输、能量代谢以及信号转导过程中起着重要的作用。实验室前期从水稻基因组中鉴定出8个OsVDAC基因,本实验从转基因植株生理功能鉴定、亚细胞定位以及互作蛋白筛选鉴定等方面分析OsVDAC6的功能及调控机理,取得以下结果:1.检测Nip、Y
电力电子装置需要用到功率因数校正(PFC)技术来解决谐波污染的问题。有源功率因数校正(APFC)变换器电路,即使在功率因数校正的效果是理想的情况下,使得输入电流为与输入电压同相的正弦电流,输入的瞬时功率仍然带有幅值为平均功率的二倍工频谐波成分,即频率为输入交流正弦电压频率的两倍,因此被称为功率二次谐波。根据这种状况,本文研究的主要目的在于寻找不需要另外在功率级主电路增加任何元件,而能够有效消减输出
近年来,单节点控制形式在控制系统中已经受到了很大的限制。面对这种情况,各界学者开始将关注放在多智能体系统的研究上。多智能体系统广泛应用于计算机网络,无人机编队飞行,以及卫星定位等领域。一致性问题是多智能体系统研究的基础,是指智能体的状态或输出基于信息传递最终趋于一致。本论文针对多智能体系统的一致性控制问题进行研究,并得到以下主要成果:1)主要考虑了非线性问题在多智能体系统中的影响,针对同时包含饱和
切换系统是常见的混合系统,它由一系列连续或离散的子系统以及协调子系统间发生切换的规则组成。由于切换系统自身的多模态特点,许多实际系统可以被建模为切换系统。此外,一个合适的切换规则不仅可以实现被控系统的稳定性而且还能获得期望的性能指标,从而进一步推动了切换系统在工业领域中的应用。如近地空间飞行器控制系统、机电系统、化学过程等。值得注意的是,许多工业生产过程通常把通信效率作为一个重要的指标。事件触发控
全球多年冻土区蕴藏着丰富的天然气水合物资源,冰的存在是影响冻土层天然气水合物开采的关键因素。部分存在于冻土层内的水合物藏,其孔隙由水合物、冰和气体填充,并且水合物通常被冰层冻结,形成“冰冻型”水合物。目前大部分研究者主要关注于冰点以上水合物分解特性,针对冰点以下多孔介质中冰冻型天然气水合物的分解研究相对较少,而且大部分研究重点关注水合物的自保护动力学及其影响因素,很少有研究者开展冰冻型水合物开采方
对变电站GIS(Gas insulated Switchgear)设备进行检修或者扩建时,必须要对其进行交流耐压试验测试。目前常用的交流耐压试验方法有双断口隔离、减小耐压试验值以及缩小耐压试验范围等,这些方法普遍存在着测试过程复杂、需全站或部分停电、部分器件未能进行耐压试验、测试结果不可靠等缺点。因此,如何避免试验过程中出现的以上问题,实现GIS设备带电交流耐压试验,并得出可靠的试验结果,对变电站
第三次消费结构升级刺激了国民汽车消费需求增长并朝着多样化、多维化发展;而同时,汽车行业进入2.0时代意味着汽车销量增长趋缓,甚至在乘用车细分市场已连续两年出现负增长,机遇和挑战并存的大背景揭示了我国汽车行业市场将进入一个由增量转存量的发展阶段,汽车行业的市场竞争态势将更加严峻,尤其给生存在合资品牌和外资品牌夹缝中的国产品牌汽车企业极大的竞争压力。当前市场主体为顾客,企业的发展依赖于市场竞争优势的获