多层次的细粒度图像识别研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zoxn2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
细粒度图像识别,又被称作子类别图像识别,是近年来计算机视觉、模式识别等领域一个非常热门的研究课题。其目的是对粗粒度的大类别进行更加细致的子类别识别,但由于子类别间细微的类间差异和较大的类内变化,较之普通的图像识别任务,细粒度图像识别挑战性更大。细粒度图像识别研究,从提出到现在,已经历了一段较长时间的发展。早期的基于人工特征的算法,基本都采用局部特征编码等方式来获取细粒度图像的特征表示,但由于特征的表征能力有限,其识别精度也往往面临很大的局限性。近年来,随着深度学习的兴起,深度神经网络促进了该领域的快速进步:一方面,基于深度神经网络的视觉注意模型能够更高效、准确地定位图像中的判别区域,为细粒度识别模型提供更多有效信息,提升其对不同细粒度子类的分类能力。另一方面,越来越多的算法倾向于不再依赖强人工标注信息,仅使用弱监督(weakly supervised)下的类别标签来完成对细粒度图像中目标及其部件的定位任务,并融合视觉编码信息,进一步提升细粒度图像的识别精度。在此基础上,本文提出基于视觉注意机制的细粒度图像识别方法,通过设计有效的视觉注意模型来获取细粒度图像的判别性特征表示,并在扁平结构、层次结构的细粒度图像识别以及有害昆虫识别上验证模型的有效性。本文的贡献主要体现在以下几个方面:1.本文在视觉注意模型方面开展了相关研究,分别提出了特征相关视觉注意、类别相关视觉注意及层次视觉注意方法。不同于以往的视觉注意方法,本文提出的特征相关视觉注意方法是通过对卷积神经网络的神经元激活响应进行融合与聚类计算,挖掘细粒度图像自身特征信息相关的视觉注意图。通过权重叠加与聚类计算获取输入图像的视觉注意图,用来定位输入图像中的目标与部件位置,从而有效地挖掘细粒度图像包含的判别性信息,较为显著地提升了细粒度图像的识别精度。为了构建任务驱动的视觉注意模型,本文进一步结合图像类别信息与对抗擦除学习,把类激活图与对抗擦除学习进行结合,构建了类别相关的视觉注意模型。对抗擦除学习能够帮助视觉注意网络进一步挖掘细粒度图像中与当前类别相关的判别区域,为识别网络提供更多有效的判别信息,提升细粒度图像的识别精度。进一步,为了解决具有层次类别标签的细粒度图像识别问题,本文还提出了层次视觉注意模型,创新性地把层次类别标签融入到视觉注意模型中,通过特别构建的损失函数实现对层次视觉注意网络的约束与优化,获取与层次类别信息相关的判别区域,进一步提升不同层次下的识别精度。2.针对多层次细粒度图像识别问题,本文提出层次类别约束模型,利用先验的生物分类层次信息完成多层次细粒度图像识别。不同于以往的层次分类方法,本文提出的层次类别约束模型充分利用不同生物分类层次下的判别区域,并依据不同生物分类层次下识别错误的严重性,提出反向追溯约束损失函数,有区别地惩罚这些错分的样本,降低识别模型对样本识别错误的严重性。此外,针对不同生物分类层次下类别之间的差异性问题,提出了层次三元组损失函数来提升模型对同一父类下不同子类的识别精度。通过层次视觉注意及层次类别约束的作用下,本文所提出的层次细粒度图像识别模型能够更好的完成层次细粒度图像识别任务。3.利用多层次细粒度图像识别网络来解决具有层次类别标签的有害昆虫识别问题。针对海关检疫的实际需求,本文对海关检疫部门提供的多达8万张有害昆虫图像样本进行归类整理,构建了具有“科”、“属”和“种”三个生物分类层次的有害昆虫数据集。在此基础上,把层次视觉注意模型与层次细粒度图像识别应用到有害昆虫识别任务中,构建了面向海关检验检疫需求的有害昆虫图像识别系统。
其他文献
天然无规蛋白(IDPs)是在生理条件下没有确定三级结构的蛋白。它在人类蛋白质组中的含量超过51%,而且与人类的肿瘤、糖尿病以及老年痴呆等复杂疾病密切相关。由于它不能结晶而且具有构象多样性的特点,导致现有的实验方法很难研究它的结构功能关系,而且Alpha Fold预测天然无规结构或区域的准确性也很低,因而分子动力学模拟就成为实验方法的重要补充。而分子力场是分子动力学模拟的基础,在一定程度上决定了模拟
学位
背景和目的肝损伤的转归除病因外,还归因于宿主因素。作为中间丝蛋白最大亚群的角蛋白,目前有超过60种疾病与其突变相关。肝细胞成对表达的角蛋白K8/18突变易导致肝损伤加重。鉴于目前仍缺乏针对角蛋白相关疾病的特效治疗,我们设想通过药物筛选来寻找能够逆转突变角蛋白结构、恢复功能并发挥保护肝损伤的小分子化学物,这将为肝损伤提供新的治疗前景。方法利用A549细胞系转染GFP标记的角蛋白K18-R90C突变的
学位
我国南海油气资源储量丰富,成为海洋油气开发的主要区域。但地形复杂、密度垂向层化稳定使得内波频繁产生,且具有振幅大、持续时间长等特点。FPSO作为油气勘探开采中主流的大型海洋工程技术装备之一,其受内孤立波作用会产生显著的漂移以及系缆断裂等事故,对FPSO的作业和安全带来严重危害,但有关内孤立波对其作用危害性机理的研究尚不深入,还缺少可供工程实际直接应用的有效评估方法。论文在充分调研以及分析问题的基础
学位
一、目的检测lnc RNA TP73-AS1在胰腺癌组织以及细胞系中的表达水平,分析其与临床病理资料的相关性。进一步探讨TP73-AS1在胰腺癌发生发展过程中的作用及相关机制。二、材料与方法首先检测了TP73-AS1在人胰管上皮细胞系(H6C7)以及另外5种胰腺癌细胞株中的表达,随后检测了其在116例胰腺癌组织及对应癌旁组织中的表达水平。体外研究采用CCK-8实验、克隆形成实验检测了干扰内源性TP
学位
钢筋混凝土(RC)结构的连续倒塌会造成毁灭性的影响,因此其在近二十年间吸引了众多学者的关注。本文针对钢筋混凝土框架结构的失效、承载力机制以及影响其抗倒塌承载性能的关键因素开展了系统的文献综述。压拱效应机制(CAA)及悬链线机制(CA)被认为是在钢筋混凝土梁柱子结构在小变形和大变形状况下的两种主要荷载重分布机制。基于文献中获取的数据,本文分析了跨高比和纵向钢筋配筋率两个核心影响参数并建立了数值方程。
学位
合作行为广泛存在于自然系统与人类社会中,并且对种群进化与社会繁荣起到重要促进作用。但是,合作行为往往伴随着成本。合作者以降低自身收益为代价提高整体收益。这与逐利个体追求收益最大化的目标相违背。因此需要额外的合作机制来调节个体收益与整体收益的关系,即驱动个体在努力最大化自身收益的同时也实现整体收益的最大化。本文针对以个体、群体和交互环境为作用对象的合作机制,分别构建不同种群状态与策略复制方程,研究了
学位
滑坡是我国主要的地质灾害,严重影响国家经济建设和社会发展。由于物理力学过程的复杂性、影响因素的多样性等原因,现有滑坡分析方法存在明显的缺陷和不足,主要包括:(a)边坡稳定性分析的强度折减法采用拉格朗日有限元,网格畸变问题造成数值不收敛的失稳判定准则得到的安全系数不可靠;(b)对于渗流-应力耦合作用显著的降雨诱发滑坡,现有研究将失稳前后两阶段完全割裂并独立分析,未考虑物理状态发展的连贯性和一致性,(
学位
基于被动式质量和惯性元件的装置,如调谐质量阻尼器(TMD)和调谐粘滞质量阻尼器(TVMD)的优化设计中,需要将装置的固有频率调谐到靠近控制结构的基频。因此,优化设计中引入一种可以基于激励电流频率来调整其固有频率的装置可以显著地增加阻尼特性。优化设计将可以去除被动式装置的失谐效应,并能在更大的频率范围内实现高效振动控制。本文提出了两种新型的振动控制装置,该装置能够基于外部激励的频率来调整和控制其固有
学位
现代的测量技术中,光学相位测量由于其精度和可扩展性被广泛的用于军事、民用以及科研之中。随着科学技术的发展,人们对于相位测量的精度提出了更高的要求。在理想情况下该精度受限于散粒噪声。对于采用了量子资源比如压缩态、纠缠态等的量子测量,精度极限可以达到甚至超过海森堡极限。但是在实际应用中,影响相位测量精度的决定性因素往往是测量方法或是测量设备引起的各类技术噪声。尤其是微小相位的测量,会被淹没在这些技术噪
学位
现代战场电磁环境日趋复杂,对于雷达的探测能力以及目标识别与跟踪能力提出了更高要求,雷达系统朝着大带宽、分布式、多频段以及全相参等体制发展。雷达射频前端作为连接射频信号和基带信号的桥梁,完成信号发射和接收的关键任务,是雷达系统的核心部件之一。基于微波光子技术的雷达射频前端具有传输损耗小、频谱资源丰富、抗电磁干扰等特性,能够弥补传统射频前端器件的部分不足,在频段选择的灵活性、宽带信号处理能力以及分布式
学位