基于可迭代学习的弱监督语义分割研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:onewxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习模型的不断推陈出新以及并行计算能力的不断提升,基于深度神经网络的图像语义分割方法取得了巨大的进步,分割性能得到了极大的提升。然而,这些方法都需要大量有标注的像素级别图像分割标签,耗费大量的人力资源来进行这样逐个像素标签的标注工作。因此,设计良好的弱监督语义分割方法,使用边界框标签或者图像类别标签,是缓解这个问题非常重要的手段。近年来,针对弱监督标签的如边界框标签设计的语义分割方法,往往都采用了一些人为设定的方法如MCG或者Dense CRF方法生成伪标签,然后用这些伪标签来训练语义分割网络。然而,这些方法并没有专门针对这些弱标签生成足够准确的伪标签,也往往无法迭代式地结合分割网络逐步提升分割性能。因此,弱监督语义分割仍然有很大进步空间。在本文中,我们针对弱监督语义分割任务提出一种可迭代学习的伪标签生成框架,提出了基于EM算法的两层优化训练架构,其中上层优化函数用来优化伪标签生成网络,底层优化函数用来优化语义分割网络。我们使用一部分有像素级别标签的辅助数据集来迭代训练一组类别无关的伪标签生成网络,目的是为了将语义分割网络经过弱标签学到的粗糙分割预测结果映射到一个较为准确的物体轮廓伪标签,然后再使用这个伪标签重新训练分割网路,进一步提升其分割性能。一旦伪标签生成网络训练完成,伪标签生成网络即可应用在新的只有边界框或者图像类别标签的数据集上,迭代的为语义分割网络提供更好的伪标签,从而提供分割性能的增强。本文针对基于边界框标签和基于图像类别弱标签的语义分割任务,都提出了对应的可迭代学习的伪标签生成网络结构,进行了实验验证。在边界框弱监督语义分割任务中,相比于传统方法利用人为设计的算法而生成的伪标签,我们的伪标签生成网络能够给出更加准确的伪标签,训练的语义分割网络性能也能够超过主流对比方法。而在图像类别弱标签的语义分割任务中,我们修改了伪标签生成网络的输入结构,使得其能够很多的嵌入到目前基于图像类别标签学习的语义分割网络方法中,进一步提升其性能,也超过了目前最好的一些方法。
其他文献
随着人工智能技术的不断发展,人机交互的需求日益提高。其中,手势识别技术在人机交互领域中的应用很是广泛。手势识别是指利用信号采集设备对个体的手势运动姿态进行采样,传输至计算机,使用模型算法对采样数据进行处理和分析。基于可穿戴传感器的手势识别系统具有便携高效,交互性能良好的优点,在商业方面的前景非常广阔。实际应用场景中,手势识别技术容易受到诸多因素的干扰。包括在环境因素下手势动作前后的无法控制的抖动、
近年来,随着机器人技术和人工智能的发展,智能机器人越来越多应用在生活中。同时,普遍认为相对于单个机器人工作,机器人集群的协同工作效率更高。比如在系统容错性方面,多机器人协同工作的容错率很高,不会因为单独的某个机器人的出错或损坏导致系统整体崩溃,而且利用机器人集群进行协同工作能够完成更为复杂的任务。ROS是目前机器人领域中最受欢迎的开源平台之一,可以有效地将底层机器人硬件封装起来,并提供大量开源工具
随着人工智能、大数据技术的飞速发展,数据资源愈发丰富,而对于数据资源的利用也越来越关键。一些与人类本身相关的医疗数据往往涉及到重大利益,这些数据的拥有方也因此无法随意交换数据,这阻碍了人工智能技术在医疗领域的发展。因此,生物医疗健康领域目前面临着因数据无法共享而产生的数据孤岛问题,针对这一问题,联邦学习成为了解决它的答案。而联邦学习过程中,多方通信节点需要进行数据对齐的过程,然而与人相关的数据在I
图像扫描显微(Image Scanning Microscopy,ISM)成像方法具有高分辨率成像特性,在生物医学领域具有广泛的应用前景。ISM在共焦显微的基础上使用阵列扫描方式实现高分辨率成像,可将分辨率提升至衍射极限的2倍,且实验装置简单、易于实现,成为超分辨显微成像领域的研究热点。但该方法需要采集大量图像,数据处理量大、成像速度慢,受扫描范围和物镜数值孔径的限制,无法满足大视场快速成像需求。
软件漏洞严重性可以帮助测试开发人员合理地分配有限的资源,优先修复更加严重的漏洞。然而,漏洞的发布和严重性的人工评估之间存在时间滞后,可能会导致“零日攻击”问题。因此,利用漏洞描述、源代码等信息自动、及时、准确地预测软件漏洞严重性具有一定的现实意义。现有方法存在以下问题:(1)每个项目的CVE漏洞描述数据量少,且不同项目的漏洞描述语言风格差异较大;(2)忽略了多个CVSS漏洞特征之间的共享信息;(3
随着智能设备的普及和信息技术的迅猛发展,视频已经成为人们生产生活中不可替代的信息载体。为了对抗视频数量的爆炸式增长,理解分析视频内容,并扩展应用到现实场景中,有助于提高人们的生产生活水平。本文针对发生在公园、停车场等公共场所中的危险性行为,设计实现了一个基于深度学习的视频行为动作识别模型,为设置在公园、停车场等公共场所中的监控设备添加自动识别并反馈危险性行为的功能,为监控人员提供一种智能化辅助解决
药物治疗对于人类的生命健康起着至关重要的作用。而药物研发过程复杂且漫长,需要投入巨大的人力和研发经费,高昂的研发成本最终影响到药物的价格和患者对治疗方案的选择。分子属性预测是新药发现中的一个重要环节,可以辅助研发人员发现候选药物,加快药物研发速度,从而降低研发成本。目前,深度学习技术在药物研发领域中的应用取得了一定的成果,不断地提高分子属性预测的准确性和可靠性成为了科研人员的主要追求。本文主要研究
航空发动机作为飞机的动力源,由于极高的加工技术、材料和设计能力要求,已成为中国航空工业的重点发展对象。高温高压环境对发动机转子工作性能提出了极高的要求,其中转子不平衡量是发动机转子优良性能评定的重要指标,它直接影响了转子的振动特性。本课题以多级盘片分离转子为对象,从装配工艺技术着手,研究降低转子不平衡量的装配方法,以改善航空发动机的工作性能。针对盘片分离转子不平衡量传递机理不清晰的问题,建立多级盘
随着计算机科学技术的进步、体育运动的普及和发展,人工智能、大数据等计算机技术越来越多的应用于体育行业当中,在体育赛事、体育场馆中计算机和数字化技术发挥着越来越重要的作用。2022年冬奥会将在北京举行,奥组委达成共识将研发智能冰壶机器人在冬奥会冰壶比赛期间进行展示互动。冰壶机器人将人工智能技术与冰雪运动相结合,是我国计算机科技水平和体育运动水平的集中体现。本文依托2022北京冬奥及龙江冰雪产业的智能
随着智能无人车技术的不断发展,使得越来越多的各种形式的无人车在工业上得到了应用。为了使人们的生活更加快捷便利,更多的研究人员致力于智能车领域的研究。移动无人车对未知环境的探索一直是其研究的热点和难点,其中定位和地图构建(SLAM)以及路径规划方案是无人设备实现自主定位和导航的关键技术。本文首先从无人车的定位和地图构建(SLAM)出发,介绍了无人车运动过程中常用的坐标系,建立了移动无人车的圆弧运动模