基于多尺度上下文信息的语义分割研究与应用

来源 :苏州大学 | 被引量 : 1次 | 上传用户:SF20070601ZW126com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割(Image Semantic Segmentation)是对图像中的所有像素按其表示的语义内容进行像素级别的分类,在遥感图像解译、自动驾驶、医疗影像分析以及无人机导航等应用场景起着重要作用。随着自动驾驶技术的飞速发展和对图像理解要求的提高,以往的图像识别技术由于只能绘制某些确定目标的边框,已经无法满足当前的精细化需求,图像语义分割成为了自动驾驶任务中图像识别与理解的重要方法。由于街道场景图像具有对象尺度变化大,存在遮挡且人工标注困难的特点,图像语义分割的难度较大。本文基于空间金字塔池化方法提取图像的多尺度上下文信息,重点结合街道场景对图像语义分割问题进行研究,主要研究内容如下:(1)针对基于空间金字塔池化方法进行街道场景图像语义分割时,在融合多尺度特征时忽略了边界信息,对存在遮挡或目标像素少的类别分类不准确的问题,本文提出了一种融入细节信息的剑状空间金字塔池化方法,并进一步提出编码器—解码器结构模型。该模型通过基于Atrous卷积及平均池化操作的剑状空间金字塔池化方法提取融入低层特征的多尺度上下文信息,其中低层特征保留了图像的边界信息,并通过解码器中的跳跃连接操作实现了对目标边界的逐步还原。在公共数据集Cityscapes上的实验结果表明,本方法在遮挡、目标像素少等情况下,仍能取得较好的语义分割结果。(2)针对现有利用生成图像进行训练的方法中分割网络模型的性能依赖于图像生成网络,而图像生成网络在训练分割模型时参数会固定无法进行有效的更新,且在对不同类别进行分割时出现类别间准确率不均衡的问题,本文提出了一种结合最大平方损失的双向域自适应学习方法。该方法通过图像生成网络和分割自适应网络之间的交替学习,使得图像生成网络在训练分割网络模型时也能够进行有效的更新,进一步提升图像生成和图像分割的性能,同时采用最大平方损失有效缓解了当前域自适应学习中的类不均衡问题。在合成数据集GTA5和真实场景数据集Cityscapes上的实验结果表明,本方法可以改善当前双向域自适应学习方法存在的类不均衡问题,表现出良好的图像分割性能。(3)基于上述研究成果,设计了一个基于语义分割模型的街道场景识别应用系统。系统主要包括模型训练和街道场景图像识别两个模块。对于待识别的图像,利用语义分割方法对图像进行分割,并对分割后的图像添加上对应的类别标签,最终输出识别结果。对该系统的实际操作结果表明,系统能进行有效的街道场景识别。
其他文献
刀具在金属切削加工过程中不断产生磨损,刀具的磨损会直接影响到加工精度和加工质量,因此开展在机监测刀具磨损情况保证零件的加工质量的研究具有较高的实用性和社会经济价值
近年来随着中国高速铁路网的扩建与高速铁路出行服务质量的提升,高速列车已经成为中国最主要的出行方式之一。预计到2025年,全国铁路网里程将长达17.5万公里,其中高速铁路占总长度20%以上,将会覆盖超过80%的大城市。高速度、高密度的高铁运行方式给铁路运输组织带来了巨大的挑战。高速行驶的列车在运行过程中不可避免地会受到各种因素的干扰,最终导致列车不能按照图定计划准时到达,产生晚点。晚点不仅会影响本列
牛病毒性腹泻病毒(BVDV)是一种有囊膜的单链RNA病毒,属于瘟病毒属黄病毒科。BVDV在牛中引起许多疾病,包括腹泻,粘膜病,持续感染,出血综合征以及生殖和呼吸疾病,导致养牛业的巨
藏族人民在长期的生产及各种实践的过程中,形成了藏医药学,它对藏族人民的生产、生活和健康起着重要的作用。藏医药学有着系统的理论知识、独特的处方及特殊的临床诊疗效果。
作为医学图像处理的两项关键技术,医学图像配准和分割被广泛应用于临床诊断、精准医疗、术后评估等多个领域。然而在实际应用中,受目标个体结构的复杂特性以及医学成像方式多
随着工业互联网技术不断发展,大数据和语义Web在工业设备能耗数据分析方面已被广泛应用。但工业设备数据处理还存在诸多问题:缺乏多功能数据分析平台、数据和信息管理复杂度
【目的】探讨涎腺阻塞性疾病:下颌下腺导管结石和慢性阻塞性腮腺炎(chronic obstructive parotitis,COP)导管造影锥形束CT(Cone Beam CT,CBCT)成像特点,与传统成像技术如咬合
目的:探讨胆管癌(CCA)、正常胆管上皮组织中PIWIL2、CyclinD1表达程度,分析两者与CCA临床各病理参数的关系并进一步评估两种蛋白在CCA发生、发展过程中是否有协同关系及其与患者预后的相关性和临床意义。方法:收集2014年1月-2017年1月于内蒙古自治区人民医院肝胆胰脾外科行手术治疗的原发性CCA(术中冰冻确诊)患者的存档石蜡包埋组织蜡块40例作为实验组,对照组选取同期因良性胆道系统
文本分类是根据文本的内容为文本分配标签或类别的过程,是自然语言处理中的基本任务,具有广泛的应用。在大数据时代,从海量文本数据中分析和挖掘有用的信息,不仅可以节省人力
随着移动网络的快速发展,移动社交应用日新月异。其中,多媒体数据(视频、音频、文本等)的分享是移动社交网络的重要应用之一。在移动社交网络中,移动社交用户可以使用便携的