基于多尺度特征增强的多标签图像分类研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:skyeyviva
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是人们同外界进行信息交互的重要载体,由于现实生活中的图像往往比较复杂,具有多语义、多标签的特点,因此多标签图像分类任务是当前图像分类研究的重点。虽然当前基于深度学习的多标签图像分类算法取得了一定的成功,但仍面临着三个主要的挑战:第一为图像中包含多个不同尺寸的目标使得分类任务中小尺寸目标易被忽略。第二为图像中存在遮挡现象,减弱了分类网络的性能。第三则由于图像通常对应多个类别,导致输出空间呈指数型增长。因此本文提出了两种多标签图像分类方法用以解决当前面临的难点,主要工作体现在以下三个方面:(1)针对多标签图像分类任务,学习研究了经典的相关算法,总结相关技术存在的缺陷,并在当前算法的基础上实现了创新。(2)针对多标签图像中包含多个语义目标的特点,提出了一种多分支集成的多标签图像分类方法。该方法充分利用卷积神经网络(Convolutional Neural Networks,CNN)不同层具有不同特性的特征,使得不同特征可以应对不同需求的目标,缓解小尺寸目标易被忽略的问题。一方面针对CNN网络高层特征具有强语义弱细节及低层特征具有强细节弱语义的特点,从不同层处引出分支。在不改变原有特征的基础上,将其他分支特征与之融合,增添更多的特征信息。并通过注意力机制注入全局信息,实现特征的进一步提取。另一方面多个分支分别进行类别预测,随后通过最优选择模块为每个类别选择效果最好的分支,并将该分支的结果作为网络对该类别最终的预测结果。实验证实该方法可有效提升网络的准确率。(3)提出了一种基于CNN与Transformer的混合网络多标签图像分类方法。在CNN网络不同层可提取到不同特征的基础上,将Transformer模型与之结合。一方面Transformer模型中的多头注意力机制对存在遮挡及视点变化的目标有更好的识别效果。另一方面利用Decoder内置的交叉注意力实现特征的自适应提取。同时直接从数据中学习标签嵌入,实现在没有图网络的前提下捕捉标签间的关系,缓解输出空间呈指数型增长的问题。两者通过信息交互实现互补,从而提取到强有力的特征,实验表明该方法能有效提升网络的分类准确率。
其他文献
中国的风险导向偿付能力体系(简称偿二代)是2016年开始正式实施的针对保险公司的风险监管体系,建立起了定量监管、定性监管、市场约束的三大支柱。在偿二代下,监管机构对以保险风险、信用风险为主的可量化风险进行定量监管,对以操作风险、战略风险为主的不可量化风险进行定性监管。战略风险影响巨大,其试错成本和纠错成本都十分高昂,重大战略规划的失误所引发的后果往往是灾难性的,因此银保监会在监管实务工作中对保险公
学位
党的十九届五中全会明确提出要实施积极应对人口老龄化的国家战略,机关事业养老保险作为保障退休人员权益的一项基本社会保障制度,在促进经济和社会发展方面发挥着巨大的作用。积极推进机关事业单位养老保险制度改革,做好养老保险基金的收支预测,提前部署应对方案,提高基金支付能力,为积极应对人口老龄化,防范化解人口老龄化风险保驾护航。2015年初,山东省政府根据《国务院关于机关事业单位工作人员养老保险制度改革的决
学位
保险公司的准备金制度是适应其负债经营的特点而建立起的维持偿付能力的安排,其初衷是保证保险公司有足够的资金以应对未来可能发生的赔付。2016年“偿二代”正式实施,偿二代以风险为导向,更为系统地监控保险公司的偿付能力。偿二代实施期间保险公司面临的风险环境发生了较大变化,因而偿二代在执行层面暴露出许多问题。2017年9月,监管部门开启了偿二代二期建设,2021年底银保监会公布《保险公司偿付能力监管规则(
学位
文本匹配方法旨在判断两段文本是否表达相同的含义或者描述相同的事件。文本匹配是一项非常重要的自然语言理解任务,在搜索引擎、在线客服等服务中有着广泛的应用。由于文本结构复杂,语义丰富,而且文本对之间往往具有复杂的交互关系,使得文本对之间的语义匹配成为一个具有挑战性的任务。因此针对当前文本匹配任务存在的问题,本文研究了一种短文本表示模型、短文本匹配模型以及长文本匹配模型,本文开展的研究工作如下:(1)针
学位
无论是过去还是现在,生命健康一直是人的基本需求。在顶层设计上,国家一直大力提倡健康生活,《“健康中国2030”规划纲要》第二篇明确指出要普及健康生活,推动广大居民养成良好的健康习惯。另外,新冠疫情爆发至今已有两年有余,在疫情持续不断的背景下,人们更加注意自身健康状况,健康意识进一步觉醒。根据健康信念模型(HBM),人的行为习惯是心里活动的外在表现,具体到个人健康习惯来说,即健康意识更为丰富的人群会
学位
随着中国老龄化程度的加剧,社会养老保险基金的压力倍增,围绕养老保险制度与退休政策施以有针对性的改革措施迫在眉睫。养老保险作为居民退休后的重要生活保障,它将如何影响退休决策值得我们关注。现有文献多为社会基本养老保险对退休决策的作用,鲜少提及年金及商业养老保险。此外,退休是一个从酝酿退休意向到实际进行退休行为的过程,而国内研究只关注退休预期或退休行为中的一个方面,对退休路径中可能存在的退休过渡期也了解
学位
图像去雾是指对雾天采集到的有雾图像进行去雾处理,使得图像清晰化,提高图像质量。近些年,图像去雾算法的研究越来越多,取得了一定的成效,然而,这些模型仍旧存在着一些问题,例如模型性能与运行时间之间的平衡、模型无法有效地去除浓雾、合成数据集上训练的模型无法有效迁移到真实场景和去雾后的图像在小目标检测上效果不好等,这些问题导致去雾算法无法在实际场景中被很好的应用,为了解决上述问题,提出本文的研究内容,本文
学位
行人重识别作为智能视频监控领域中一项关键性技术,旨在从非重叠视角下的监控摄像头采集的图像数据中正确识别出属于同一行人的图像。近年来,深度学习的发展给行人重识别的研究提供了有力的技术基础,其中基于局部特征的行人重识别方法能够有效提升行人重识别准确率,但是大多忽略了行人局部特征之间潜在的关系,由于受到复杂背景噪声和行人姿态变化的影响,以及行人图像间存在相似行人外观或局部遮挡等情况,给行人重识别的研究带
学位
在经济快速发展与生态环境保护相冲突的时代背景下,我国愈发重视对生态文明的法制建设。但是基于社会连带关系,环境侵权责任从矫正主义向分配主义发展和以受害人为救济中心的理论基础,环境侵权责任向社会化方向发展,环境侵权法律制度不能有效解决生态环境污染案件,环境责任保险应运而生。环境责任保险,是设立于环境侵权责任基础上的险种,与环境侵权法律制度的发展密不可分。《民法典》侵权责任编的实施进一步推动环境侵权法律
学位
系统发育树构建是古生物系统发育分析的最终表现形式,是一个非常重要的计算生物研究领域,它帮助人类了解生物起源、进化以及未来发展方向。在古生物系统发育分析中,通常采用化石中采集到的形态学数据,根据物种的形态特征构建出一棵能够体现物种间进化关系的发育树。目前古生物系统发育分析研究正面临着以下几种问题:首先,由于化石保存不完整、物种之间的差异以及特征间存在层次关系等因素,使得古生物形态学数据中存在缺失和不
学位