基于注意力机制的小样本目标检测

来源 :东华大学 | 被引量 : 0次 | 上传用户:bupingzhenren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
小样本目标检测旨在仅有少量带标签的训练集图像的条件下,从查询集新类图像中检测到指定目标。目前小样本目标检测任务大多基于迁移学习模型,将大样本图像元特征信息迁移至小样本图像,实现小样本目标检测,其难点在于充分利用图像中的细节特征信息。注意力机制可以自适应地增强对图像前景目标区域的感知,本文通过引入注意力机制模块解决上述难点,提升小样本目标检测性能。本文分别设计了基于注意力机制和元特征二次重加权的改进的元特征迁移模型,以及基于自适应注意力机制和LM Softmax(Large Margin Softmax)的改进的稠密网络模型。并在中国古代丝绸图像数据集上验证了本文所设计的小样本目标检测模型的性能。具体工作如下:一、针对小样本目标检测中缺乏关注图像细节特征信息的问题,本文基于注意力机制和元特征二次重加权机制,提出改进的元特征迁移模型。在元特征迁移模型中引入基于CBAM(Convolution Block Attention Module,卷积块注意力模块)网络的注意力机制,使特征提取网络聚焦图像中的目标区域,关注图像目标类别的细节特征,提升模型对小样本图像目标的检测性能。其次引入基于SE(Squeeze and Excitaton)的SE-SMFR(Squeeze and Excitation-duple Meta Feature Reweighting,元特征二次重加权)模块,对大样本图像元特征二次重加权,获取二次重加权元特征,使模型在提升小样本目标检测性能的同时减少大样本图像元特征信息的权重偏移。实验结果表明,相比于原始元特征迁移模型,改进后的模型在通用数据集PASCAL VOC数据集上针对小样本图像m AP(mean Average Accuracy,平均检测准确率)为41.9%,增长约5%,针对大样本图像m AP提升约2%。二、针对小样本目标检测中缺乏关注小样本图像特征信息机制的问题,本文基于自适应注意力机制和LM Softmax损失函数,提出改进的DC-NET/ATT(Dense Relation Distillation with Context-aware Aggregation and Adaptive Attention Network,稠密网络)模型。设计自适应注意力机制,结合大样本图像调整模型对于小样本图像中目标的关注区域,使模型关注小样本图像目标本身的特征信息;考虑到图像类别增多时,模型分类性能会受到影响,采用LM Softmax损失函数改善模型分类效果,提升模型分类性能。实验表明,本文所提改进后的小样本目标检测模型在PASCAL VOC数据集上针对小样本图像的m AP为50.8%,与原始稠密网络模型相比增长约6%;在MS COCO数据集上针对小样本图像的m AP为13.1%,增长约2%。三、为验证上述小样本目标检测模型在真实场景中的性能,本文应用Label Img工具制作古代丝绸图像数据集及其标签文件,采用数据增强的方式扩充数据并结合PASCAL VOC数据集进行训练,分别采用本文所设计的两个基于注意力机制小样本目标检测模型对古代丝绸图像中的动物图案进行目标检测。实验结果表明,本文所提的基于注意力机制的小样本目标检测模型能够关注到丝绸图像中动物图案的细节特征;与近期基于迁移学习的小样本目标检测模型相比,针对古代丝绸图像数据集中动物图案的检测任务具有较好的检测性能。
其他文献
本文以导弹为研究对象,针对其绕质心运动具有非线性和不确定性的特点,开展了自适应姿态控制方法及摆角优化方法研究,基于对各飞行段弹道特性和制导任务特点的分析,开展了助推段预测-校正制导方法以及制导控制协调优化方法研究。主要研究内容如下:为解决导弹助推段姿态控制面临的参数不确定与外界干扰问题,提出了基于干扰估计补偿的自适应动态面控制方法。在简化条件下建立了含参数不确定与外界干扰的导弹姿态控制模型,引入非
学位
深度学习自从2010年兴起以来,它的发展彻底改变了语音识别、计算机视觉和自然语言处理。经典的深度学习任务专注于单个模态下的输入与输出,但是随着人工智能领域不断发展,越来越多的工作开始考虑多模态智能。多模态智能不仅依赖于单模态的发展,而且需要处理多个模态的融合问题。在深度学习应用方面,服装产业正在凸显其重要价值。服装业依托于成熟的电子商务平台,进入快速爆发的阶段,每年都会有成千上万的服装款式被设计出
学位
关注幼儿户外区域游戏活动的组织与开展,是进一步践行《3-6岁儿童学习和发展指南》的基本体现,也是促进幼儿深度学习的有力举措。对此,本文在分析深度学习概念的基础上,从依托户外游戏活动,夯实幼儿经验积累;保障游戏活动时间,重视整合活动区域;关注幼儿游戏行为,适时解读活动现象;适时开展学习评价,深化幼儿活动经验四个方面阐述了促进幼儿深度学习的有效方法,以期引发幼儿主动探究的活力,使户外活动区发挥出应有的
期刊
<正>传统人力资源管理制度缺乏思想建设,思政教育可有效解决该问题,有助于企业人才管理。而在人力资源管理工作融合思想政治教育,对企业管理水平提升来说,具有十分重要的作用。
期刊
报纸
国有企业的高质量发展要靠坚持党的领导、加强党的建设。国有企业应将党的建设作为主线,将党的理论作为基本指导,全面贯彻党的路线、方针与政策,将党的政治优势转化为企业思想政治工作的优势。对国有企业思想政治工作的现状进行分析,并对新形势下国有企业思想政治工作提出建议,为探索加强思想政治工作助推企业高质量发展,提出新思路以及可借鉴的新模式。
期刊
作为一种缓冲吸能结构,扩胀管具有可控的变形模式、吸收能量不可逆等特点,在航空航天领域和交通运输领域得到了广泛的应用。目前很多学者已经对扩胀管在准静态下的扩径力学响应和缓冲吸能特性进行了研究,取得了显著成果。但是对于扩胀管在动态加载下的研究相对较少,且现有研究都是基于大尺寸、高吸能能力的扩胀管展开的。本文以小规格扩胀管为研究对象,采用静、动态加载结合的手段,对扩胀管的扩径力学响应和缓冲吸能机理进行了
学位
可见光遥感图像在军用和民用领域都发挥着重大的作用,可以应用在灾害控制、海洋监控、城市规划、生态环境监测等诸多领域。随着遥感技术的快速发展以及卫星和航天器的增多,我们能得到数量更多、分辨率更高的可见光遥感图像,图像中小型目标更加清晰可见,这既显著提高了可见光遥感图像的信息含量,又对其目标检测方法和技术的精确性提出了更高的要求。基于深度学习的目标检测算法已在自然图像目标检测领域取得了优异的成绩。但由于
学位
由于与环境污染和城市拥堵等其他重要问题有关,车辆交通正引起越来越多的科学兴趣。从经济和社会的角度来看,车辆流量的合理规划和管理是现代社会的重要课题,越来越多的项目旨在监测和优化道路交通的质量。车辆交通不仅是一个工程问题,而且是一个具有挑战性的数学问题。本文将通过Aw-Rascle-Zhang模型来描述宏观交通流系统,基于这种偏微分系统的控制方式有边界控制和域内控制两种方式。边界控制主要是通过静态交
学位
固体导弹由于体积小、机动性好、打击精度高、发射准备时间短,且可利用发射车机动发射等突出优势,成为世界各国武器研究的重点。本文以固体导弹为研究对象,针对导弹任务多样性需求,围绕助推段终端能量宽域可调开展研究。主要研究内容如下:1.导弹助推段标准弹道设计。首先建立导弹助推段运动模型,然后对助推段飞行程序进行参数化建模,在其基础上采用灰狼算法进行标准弹道设计。主要思路是以攻角模型的关键参数为优化变量,以
学位