【摘 要】
:
小样本语义分割的目的是在仅有少量带标注的训练数据可用的情景下训练模型,让模型学习到具有通用性的分割能力,从而在新类上也能保持较好的分割效果。现有的小样本语义分割模型往往使用单一原型描述整个类别,然而由于样本量匮乏和类内变化的存在,生成的单一原型往往不具有代表性,存在语义模糊的问题。此外现有方法使用全局平均池化提取类别原型,忽略了对于背景信息的使用,然而前景和背景特征之间往往存在语义关联。针对以上问
论文部分内容阅读
小样本语义分割的目的是在仅有少量带标注的训练数据可用的情景下训练模型,让模型学习到具有通用性的分割能力,从而在新类上也能保持较好的分割效果。现有的小样本语义分割模型往往使用单一原型描述整个类别,然而由于样本量匮乏和类内变化的存在,生成的单一原型往往不具有代表性,存在语义模糊的问题。此外现有方法使用全局平均池化提取类别原型,忽略了对于背景信息的使用,然而前景和背景特征之间往往存在语义关联。针对以上问题,本文展开了一系列的研究,本文的主要研究内容如下:1.阐述了小样本语义分割的研究背景及意义,对全监督语义分割的发展历程和模型中的常用组件进行了概述,详细介绍了小样本语义分割的基本方法和理论,并对各类小样本语义分割方法的设计思想和优劣进行了分析,总结了小样本语义分割模型的训练优化方法和性能评估标准。2.针对单原型导致的语义模糊问题,提出了一种基于超像素的多原型生成方法,并使用图卷积网络对生成的多个原型利用上下文信息执行校正。在模型中引入了语义匹配模块生成最优匹配方案,以充分利用来自查询图像的特征,从而丰富原型的特征表示。此外还设计了一种原型分配模块,基于特征余弦相似度执行原型分配,并结合多个原型的相似度图生成更加精确的先验相似度图,从而提高分割性能。3.针对背景特征未被充分利用的问题,提出了一种基于背景参照的小样本语义分割模型,在模型中引入了特征融合模块,分别从前景和背景角度融合来自支持图像和查询图像的特征,利用通道和空间注意力关注查询特征和支持特征中的高相似部分,从而分别获得前景和背景的特征表示。为了挖掘前景特征和背景特征中存在的语义关联信息,在模型中引入了基于Tranformer的语义挖掘模块,从而使模型进一步学习到隐含的语义信息。最后分析了常用的多尺度结构ASPP的不足,提出了一种带有特征选择器的多尺度模块,从而过滤特征中的噪音,避免对分割过程产生干扰。
其他文献
多标签特征选择在高维多标签学习任务中起着至关重要的作用,并被广泛用于文本分类,Web数据挖掘等领域。现有的多标签特征选择方法主要是探索特征-标签、特征-特征和标签-标签的相关关系中的两种,少数方法能够同时处理三种类型的相关关系。如果能够同时考虑三种相关关系,可以获得带有更多辨识信息的特征子集,用于构建性能更加优越的预测模型。为了解决这个问题,本文将多标签特征选择问题转化为局部因果结构学习问题,围绕
知识图谱是一种用来描述现实世界实体之间相互关系的知识库,其已在搜索、推荐和问答领域得到广泛的应用。大规模的知识图谱难以完全依靠人工构建,因此自动化的构建知识图谱成为了研究的热点问题,其中命名实体识别是构建知识图谱的基础任务之一。目前,基于Transformer的预训练语言模型在解决命名实体识别任务上得到广泛的应用,但这类方法通常需要高质量的标记数据进行微调,难以在无监督或弱监督的情况下实现较好的命
贝叶斯网络是不确定性知识表达与推理的重要工具,是数据挖掘、人工智能和机器学习等领域中的重要研究方向之一。在大数据时代,由于数据的高维度,学习整个贝叶斯网络结构是一个耗时甚至不可能在有限时间内完成的任务,这使得学习一个给定变量的局部贝叶斯网络结构成为一个新的探索方向。然而目前的局部贝叶斯网络结构学习算法仍存在很多问题需要进一步探索,因此,本文开展基于约束的局部贝叶斯网络结构学习算法的相关研究,主要取
近年来深度学习快速发展并攻克了计算机视觉不少难题,然而这些成果通常是建立在大量标注数据的基础上。大量标注数据意味着高昂的成本,且许多应用由于标注数据不足而难以落地。小样本学习旨在通过少量标注数据训练得到一个性能良好的模型而成为受许多人关注的领域。在图像分类任务中,现有的大多数小样本方法仅利用样本视觉信息,而忽略与之相关的文本信息。事实上,在视觉数据较少的情况下,引入其他模态信息并合理运用有助于提升
中国聚变工程实验堆(CFETR)是中国自主设计和研制的衔接EAST和ITER的下一代聚变反应堆。CFETR堆芯部件运行在,高温、强磁场、中子辐照的恶劣环境下,其结构造成不同程度的损伤甚至是失效,严重时影响装置的正常运行。为了确保聚变堆的安全运行,需要定期对堆芯部件进行维护。遥操作是替代人工在恶劣环境下对内部部件进行远程维修的技术。在此背景下,中国科学院等离子体物理研究所遥操作维护团队设计了一款多功
强化学习作为机器学习的重要分支,因其良好的决策能力,近年来受到了广泛关注。将强化学习融合到多智能体系统形成了多智能体强化学习,其已经成为人工智能领域的研究热点。传统的多智能体强化学习算法仅考虑外在动机,即根据环境的外在奖励引导智能体进行策略学习。当外在奖励稀疏或分配不明时,会导致智能体学习缓慢甚至无法学习到有效策略,这就是多智能体强化学习普遍存在的稀疏奖励问题和全局奖励贡献分配问题。本文提出了基于
区块链通过可追溯的分布式账本和非对称加密技术等手段,在不依赖于任何第三方可信机构的前提下,解决了分布式信任问题。因此,基于区块链提供可信的物联网数据已受到了越来越多的关注。共识作为区块链中的核心,需要大量的计算资源,因此资源有限的终端设备无法进行共识。将终端设备的计算任务卸载给边缘计算服务提供商(ESP)或云计算服务提供商(CSP)被认为是移动区块链共识的一种可行的解决方案。本文研究了基于区块链的
传统的视觉同时定位与建图(Simultaneous Localization and Mapping,SLAM)无法完成与环境之间的交互任务,而且当环境中存在动态物体时,系统的定位精度会大幅下降,融合了语义信息的SLAM系统能够较好地解决上述问题。获取周围环境中的语义信息是语义SLAM的重要任务,然而,采用语义分割或实例分割网络会影响系统的时间性能,采用目标检测方法又会损失一部分精度。因此,本文提
对话问题生成旨在根据给定长文本和对话历史生成对话式问题。在日常生活中,对话式问答更为常见,人们之间进行连续问答来传递信息。对话问题生成可广泛应用于教育、医疗和商业服务等领域,具有较大的应用前景。目前研究对话问题生成的主流方法是基于深度学习技术设计神经网络模型,然而模型生成的对话问题距离应用仍有很大的差距。本文主要基于序列到序列模型和预训练模型来分析如何提升对话问题生成的性能,本文主要的工作如下:(
随着无线通信技术和先进传感器制造技术的发展,车载自组织网络(Vehicular Ad hoc Networks,VANETs)中的V2V通信越来越受到业界和学术界的关注。这种以高速移动的车辆为通信节点的无线通信机制受到信道资源有限和网络拓扑结构不稳定的限制。为有效提高网络性能和通信的稳定,本文首先在对车辆进行分簇的前提下,通过合理控制车辆在高节点密度环境下的通信发射功率,提出一种基于串行干扰消除(