【摘 要】
:
计算机视觉任务需要一种媒介作为信息载体,而图像是最基础并且最常见的信息载体,其中图像分类和图像目标检测任务便是以图像为信息载体的最基础的计算机视觉任务之一。通常而言图像可以分为单标签图像(比如图像中只包含“狗”或“猫”)和多标签图像(比如图像中包含了“天空”、“白云”和“彩虹”)。在现实生活中,如果不刻意为之的话,我们获取的图像往往包含多标签信息,因此针对多标签图像的研究具有真实场景下的广泛应用价
论文部分内容阅读
计算机视觉任务需要一种媒介作为信息载体,而图像是最基础并且最常见的信息载体,其中图像分类和图像目标检测任务便是以图像为信息载体的最基础的计算机视觉任务之一。通常而言图像可以分为单标签图像(比如图像中只包含“狗”或“猫”)和多标签图像(比如图像中包含了“天空”、“白云”和“彩虹”)。在现实生活中,如果不刻意为之的话,我们获取的图像往往包含多标签信息,因此针对多标签图像的研究具有真实场景下的广泛应用价值。多标签图像学习是针对如何利用图像多标签信息的一个计算机视觉领域研究方向,其目的是利用图像的多标签信息来改进计算机视觉相关任务。然而由于多标签图像中每张图像所包含的标签各不相同,并且每张图像包含的标签数量也不固定,这使得图像多标签的研究相比单标签更具挑战。目前主流的研究多标签图像学习算法主要从两个方面展开,一是利用多标签图像信息改进多标签图像识别算法,该方向的关键是如何合理并且高效地建立标签之间的关系。二是利用图像多标签信息辅助其他计算机视觉任务,该方向的重点是如何合理地挖掘图像多标签信息并有效的与这些计算机视觉任务相结合。本文基于深度学习方法,从利用多标签图像信息构建标签之间的关系以改进多标签图像识别方法和辅助图像目标检测任务这两个角度出发对多标签图像学习展开研究,主要工作包括:1.提出了一种基于多标签图结构的多标签图像识别方法。捕获标签之间的关系是解决多标签图像识别问题的关键,现有的方法主要分为构建图像间标签关系和图像内标签关系两大类。目前构建图像间标签关系的方法都需要额外的信息(词嵌入向量)来构建图节点,而这些额外的信息可能会对性能造成影响。本文方法利用网络结构过滤出每个类别的特征激活向量来作为图节点信息,因此无需任何额外信息来辅助训练。具体来说,首先本文设计了一种高效的方法来从数据集中挖掘出标签之间的共现关系,然后采用图卷积网络来把这些关系构建成图结构。此外,本文还从输入图像的全局特征中解耦出每个类别对应的特征激活向量来作为图结构的输入节点。在网络的学习过程中,类别特征激活向量之间的信息会通过图结构的有向边进行传播,并以此来构建图像间的标签关系。在多标签数据集上的实验结果表明本文的方法能有效提高多标签图像识别的精度。此外,在多标签图像的部分标签识别任务上,本文的方法也能得到非常有竞争力的结果,这表明本文的方法具有良好的泛化能力。2.提出了一种基于度量学习的多标签图像识别方法。除了研究如何合理地构建图像间标签关系之外,本文还研究了如何构建图像内的标签关系。现有的构建图像内标签关系的方法多是使用注意力机制来间接地构建标签的关系,因此无法准确建立图像内的标签关系。而本文通过重新设计网络结构,并采用度量学习的方式来直接的捕获图像内的标签关系。具体来说,本文首先解耦出每个类别对应的类别相关特征。然后本文把类别相关特征映射成相应的标签向量,并且通过拉近相关标签向量的距离,同时拉远不相关标签向量的距离来构建图像内的标签关系。此外,本文还设计了排序操作来进一步的优化标签向量之间的距离。最终,相关标签向量之间的距离会约束网络在训练中的特征学习过程,这将让相关标签的类别相关特征具有相似的激活程度,从而构建图像内的标签关系。大量的实验结果和可视化结果证明了该方法能有效建立图像内的标签关系并提高多标签图像识别任务的精度。3.提出了一种基于图像多标签上下文信息的目标检测方法。图像的多标签不仅可以应用在多标签图像识别任务中,还可以用来辅助其他计算机视觉任务。本文从图像目标检测任务出发,分析了当前的二阶段目标检测器由于忽略了图像多标签信息,从而造成感兴趣区域特征可能缺少关键的上下文信息,而这些上下文信息对于抑制背景错误正例以及识别不具有明显外观的物体是至关重要的。虽然目前有部分方法在致力于挖掘上下文信息以提高检测性能,但是由于受到特征激活位置不准确和感受野的影响,因此检测器的性能提升有限。为了解决上述问题,本文利用了图像的多标签信息来挖掘检测器的上下文信息。具体来说,本文首先利用图像多标签将上下文信息嵌入图像全局特征中。然后,本文通过利用该特征在整个图像和感兴趣区域生成层次上下文感兴趣特征。最后,为了能充分利用层次上下文感兴趣特征,本文设计了两种不同的融合策略来对检测器原始的感兴趣特征进行融合,以此来提高检测器的分类能力。全面的实验表明,本文的方法灵活且通用,对于几乎所有的主流二阶段检测器都产生了显著而一致的改进。此外,本文还对该方法在一阶段检测器上进行扩展,实验结果表明本文的方法依然能够提升一阶段检测器的性能。
其他文献
第一部分肠I/R损伤大鼠模型的建立及骨骼肌高分解代谢与胃肠激素、中枢神经肽相关性分析目的:验证肠I/R损伤导致的骨骼肌高分解代谢同肠道内分泌激素改变和下丘脑神经肽改变是否有相关性。方法:将成年雄性Spragu-Dawley大鼠随机分为肠I/R组和对照组,肠I/R组开腹行肠系膜上动脉阻断30分钟,对照组实施相同步骤但不阻断肠系膜上动脉。记录术后24h、Day1、Day3、Day5和Day7摄食量和体
传感器件作为柔性电子学或塑料电子学的一个分支领域,日益发展成为了融合电子科学、材料科学、计算机科学等多个领域的重要研究方向,在可穿戴式或植入式器件、人机交互、智能假肢、柔性机器人等领域具有广阔的应用前景。回顾近年来柔性传感器的发展历程,一方面,本征柔性材料的研发赋予了器件优良的机械特性,尤其是聚合物材料作为新型信息功能材料具有制备简单、性质可调控、对环境敏感的优点,可作为各类传感器件中的敏感材料;
灯戏是一种民间戏曲,属国家级“非遗”,具有历史、文化、教育、审美等多重价值,如今面临困境,只有加大保护力度,才能促其传承发展,档案式保护就是重要的基础性工作。其中,一要抓好“抢救”工作,通过开展普查和运用科技手段,全面收集实物、文献、技艺等相关资料;二要抓好“保管”工作,通过鉴定、分类、载体建设等环节,建立相关档案;三要抓好“利用”工作,包括开展研究、出版、创作和宣传,使之现实作用最大化。
疏水相互作用是一种非共价相互作用,在蛋白质折叠,配基和受体的结合,膜的形成等生命化学过程中发挥了重要的作用。疏水相互作用研究的一个重要方向是疏水自由能的计算。Lum,Chandler和Weeks等人提出的疏水自由能的尺度依赖理论(LCW理论),使我们对疏水水合机制有了一个全新的理解。小尺度的疏水粒子水合,疏水自由能与粒子体积成正比,是一个熵效应主导的水合过程。大尺度的疏水粒子水合,疏水自由能与粒子
近年来,随着人类生产生活对新型卤代有机物依赖度的日益增加,其水环境污染问题逐渐凸显,已经引起科学界的广泛关注。自然衰减和传统污水处理工艺无法有效去除大部分此类污染物,因而迫切需要开发兼具成本和环境效益的降解处理技术。本论文以构建能源高效利用的环保型水处理技术为切入点,选取具有结构代表性的双氯酚(DDM)、阿托伐他汀(ATV)和全氟及多氟类化合物(PFASs)三种新型卤代有机物为目标化合物,系统研究
气孔是分布在植物表面特异化的表皮细胞,它们在平衡植物与环境间气体交换,水汽蒸腾以及调节光合作用的过程中发挥着至关重要的作用。气孔发育受到内部受体蛋白TMM-ERf相关信号通路和外部因素的严格控制,其中植物激素是最为高效的调节因素之一,而植物激素的代谢平衡与β-葡糖苷酶密切相关。天冬酰胺糖基化(N-glycosylation)是真核细胞中最重要的蛋白翻译后修饰之一,通过调控蛋白的折叠、转运和分泌等过
原载《中行生活》第1期(1932年5月15日),原标题为《一封行员的信——希望编印一种表现全行生活的刊物》,是张公权为《中行生活》创刊所撰发刊词(1)。张公权拟将《中行月刊》办成内外兼顾的"‘团体精神’载体",但后来,初衷没有实现。他在1932年3月7日的日记中说:行中因《中行月刊》过于研究学术方面,不能促进同事普通思想生活之改善,因决定将《中行月刊》公开发行,另发行《中行生活》,专为行中同事自由
波粒二象性是量子系统的基本性质之一,在量子理论的发展中引发了长期的讨论。经典的局域实在论认为,波动性和粒子性是光子的固有属性,单个光子只会表现出其中一种性质。这种观点无法解释光子表现出的性质与实验者观测方式之间的关联,而必须假设光子预先知道实验的设置信息,并选择表现出相应的性质。Wheeler延迟选择实验提出对上述假设的检验方法:在光子经过第一个分束器之后,再决定是否放置第二个分束器,从而确定Ma
单分子电子学利用单个分子作为电子元件的功能单元,是替代硅基电子器件的一种潜在可能,受到了物理、化学、电子等多个领域的广泛关注。一方面,单个分子的尺度极小,它的性质由量子力学效应所主导,具有分立的能级结构。研究单能级系统的输运行为,有利于基础科学的发展;另一方面,单个分子有望实现更高的集成度,可以减小功耗、降低成本。丰富的分子种类可以产生更多的电学功能,有利于应用技术的发展。随着微纳加工、分子合成和
数字化时代,支持边缘计算的物联网能够不断产生并传输数据,为用户提供各种服务。由于资源限制和异构性约束,服务提供商到消费者的端到端的服务协调,是边缘物联网可持续发展的关键问题。边缘计算通过将资源带到网络“边缘”,进而为资源有限性提供了一种可行的解决方案;然而在这种分布式环境下,资源的最优分配、安全和隐私都是亟待解决的挑战。此外,硬件和通信协议的异构性,则给分布式物联网应用开发带来新的挑战。目前界内较