弱监督语义分割算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:dfdfdfdfgdfdfg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割是图像理解的关键部分,是一项基础的计算机视觉任务,其广泛应用于自动驾驶、医疗图像分析、智能监控等领域。现有的语义分割方法大多数都是全监督语义分割方法,全监督语义分割方法需要大量的像素级标注来训练语义分割网络,然而获得大量具有像素级标注的图像集需要很大的时间和人力成本。为了降低人力和时间昂贵的成本,研究者们提出弱监督语义分割方法。弱监督语义分割方法仅仅只需要图像类别等弱标签去训练分割网络,所以如何利用弱标签信息去构建图像级标签语义和像素点之间的关联是弱监督语义分割方法的关键所在。本文提出了两种弱监督语义分割方法,具体工作阐述如下:1.基于对抗学习机制的弱监督语义分割方法完全监督语义分割在像素级标签数据增强时与输入图像会发生相同的空间变换,但在弱监督语义分割中目标定位图时像素级标签在仿射变化时与输入的图像不会发生对应的空间变化,而这种等变性可以利用来提高弱监督信息。本文提出了一种使用对抗学习机制的弱监督语义分割方法,利用孪生网络产生原始输入图像及其仿射变换的类激活特征图,将孪生网络作为生成网络,判别器网络对孪生网络产生的两组目标定位图进行对抗学习,训练孪生网络对输入图像和其仿射变换图像产生类似的目标定位图,从而有效利用等变注意力机制,学习更多的有效信息并缩小类激活特征图和真实的像素级标签之间的差距。实验结果表明提出的方法能有效提高弱监督语义分割的性能。2.基于多注意力机制的弱监督语义分割方法本文首先利用类激活特征图方法判断出目标稀疏种子的区域,但它与真实的像素级标签信息存在较大差距,所以训练效果并不理想。其次利用空洞卷积原理,通过改变卷积核的扩张率来扩展多尺度的感受域。扩大扩张率促使着生成的目标区域也随之扩大,同时生成的目标区域存在噪声类别输出与语义信息不足的问题。最后为了实现完整的目标区域,本文提出了多注意力机制模块来缓解上述问题。利用多注意力机制对不同扩张率的卷积核产生的目标区域进行融合,提取了扩张率低的精准目标区域和扩张率高的目标区域,同时抑制了生成的目标存在噪声区域与语义信息区域不足的问题。从而可以有效的挖掘出目标的区域位置用来训练语义分割网络。实验结果表明提出的算法能有效提高弱监督语义分割的性能。
其他文献
我国目前已是世界最大的铜材生产国,但仍不是铜材生产强国,低端产能相对过剩,而高、精、尖等高端铜材产品部分仍依赖进口,难以满足我国各行业对高端铜材的需求。此外,我国数量众多的中小型铜加工企业的产品质量水平及成品率普遍较低,这也是制约我国铜加工行业发展的突出问题,而究其原因,铜加工企业产品质量问题主要是由生产工艺技术上管理粗放造成的。近年来,为实现提质增效的目标,在国家及地方政府的政策鼓励下,国内铜加
糖尿病视网膜病变、心血管疾病、高血压、动脉硬化等多种疾病对视网膜血管产生不同影响,可通过分析视网膜眼底图像中血管的长度、宽度、角度、弯曲度和分支形式等特征来诊断。人工分割视网膜血管是一项繁琐、复杂和专业性极强的工作,且分割标准主观性强。为提高医生的诊断效率和降低误诊率,需借助计算机辅助诊断系统,其核心是设计先进的分割算法,以实现快速自动化视网膜血管分割。于是,本文分别提出了两种分割算法:基于多尺度
随着新兴技术的不断涌现和持续应用,中国制造业在过去十年间发生了翻天覆地的变化,在不断适应多变的社会需求和激烈的市场竞争的过程中,制造型企业慢慢从以量取胜向着以质取胜发展。质量意识的不断提升,使得越来越多的制造型企业开始注重生产的规范化与标准化,标准作业指导书由此受到越来越多的关注。然而,标准作业指导书在规范作业程序的同时,自身的制作流程却没有实现标准化作业,这是因为许多企业重点着力于生产线的优化改
目的研究行电子输尿管软镜下钬激光碎石术治疗的肾结石患者开展手术室人性化护理干预的效果。方法选取玉山县人民医院2019年8月—2020年1月期间收治的肾结石患者56例为研究对象,均接受电子输尿管软镜下钬激光碎石术治疗,采用双盲随机法分为研究组(28例)及对照组(28例)。对照组行手术室常规护理,研究组患者在此基础上接受手术室人性化护理干预,对2组患者术后恢复情况进行比较分析。结果研究组患者术后离床及
随着GNSS等新技术的发展,大坝变形监测已经实现全天候实时动态化,传统的大坝变形预测方法不能很好地对海量的监测数据进行处理。深度学习是在神经网络的基础上对网络层数加深的优化算法,目前已经在风电、空气质量、灾害预警等领域广泛应用。相对于传统的机器学习算法,深度学习强调从海量数据中进行学习,能够解决大坝变形数据中存在的高维、冗杂以及高噪等传统机器学习算法难以处理的问题。因此,非常有必要开展基于深度学习
随着互联网技术的发展,信息技术时代逐渐过渡到数据技术时代,数据在人们的生活中充当着越来越重要的角色。面对无所不在的数据,如何从当中获取到所需的信息变得十分困难了,这就是所谓的“信息超载”问题。传统的推荐系统在一定程度上缓解了这个问题,通过分析用户的历史行为,从海量的数据中分析出用户的偏好,并把具有用户偏好的物品推荐给用户。然而在实际应用中存在数据稀疏、冷启动等问题,它会导致推荐系统准确率低、推荐单
近年来,人工智能已成为了人们生活密不可分的一部分。随着科技的不断发展与进步,计算性能的不断提高,深度学习的发展更是迅速,而生成对抗网络作为深度学习的重要组成部分,在计算机视觉领域取得了众多成就。同时,在物质生活得到满足的当今社会,越来越多的人对动漫领域产生浓厚的兴趣,而生成对抗网络在动漫领域的应用也得到了更多人的关注,如人物图像的动漫风格迁移以及动漫头像的生成等。但是在动漫头像生成方面,仍然存在两
杨梅是浙江省重要的农果经济作物,稳居果树产值第一。然而由于杨梅树大多种植在山地丘陵地区且种植分散,致使果树种植与管理耗费大量的人力物力,因此采取自动化的方法提取杨梅树株数,实现大规模、分散果园的高效管理。但是使用卫星遥感图像提取果树往往面临方法流程繁琐、人力成本高、耗时长等问题。随着计算机软硬件的发展,基于深度神经网络的目标识别方法逐渐应用于农业、交通、医疗等行业。本文提出应用深度神经网络YOLO
目标检测是计算机视觉领域的重要研究方向之一,广泛应用于工业生产中。在检测任务中,对于一张输入图片,检测算法通过学习来区分图片的前景和背景,然后从背景中分离出感兴趣的目标物体,进而判断物体所在的具体位置和所属类别。然而由于小物体面积小分辨率低,使得对于小目标的检测精度不能达到理想的效果。针对小目标检测的问题,本文基于SSD(Single Shot Multi Box Detector)模型做出改进,
随着计算能力的提升,计算机视觉相关技术发展迅速。图像合成技术作为重要其中一个重要分支,同样发展迅速。本文深入研究了图像合成相关技术,介绍传统模型和基于深度学习的图像合成模型实现原理,并总结归纳各自的优势和不足。同时以复杂场景图像生成为主要研究对象,介绍了基于不同条件的图像合成方法实现,以及它们在各自领域的应用和已经取得的成果,并重点介绍了它们在实现包含多个前景对象的复杂场景图像生成任务上的优势和不