嵌入多尺度模块和注意力机制的图像语义分割

来源 :山东工商学院 | 被引量 : 0次 | 上传用户:muscleprince
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割旨在实现图像像素级分类,即为图像中的每个像素分配类别标签,计算机通过图像语义分割算法将图像分为不同的区域,每个区域都是一类对象,并且为区域标注类别信息,为进一步理解图像奠定基础。近年来,基于深度学习的图像语义分割算法取得了较大成功,本文首先研究了具有代表性的图像语义分割模型,并在此基础上改进了UNet网络模型。为了提高卷积神经网络(Convolutional Neural Networks,CNNs)的特征表达能力,将通道注意力机制和空间注意力机制嵌入到UNet网络中,提高了分割的平均交并比m Io U;为了扩大感受野,聚合多尺度上下文信息,将UNet编码器中的普通池化层替换为空洞卷积池化层并且在解码器后加入空洞卷积金字塔层,改善分割效果;为了获取全局上下文信息,将CRFs条件随机场模型加入到Seg Net网络中端到端得训练,得到更加清晰的分割边界。(1)提出了基于CBAMUNet的图像语义分割模型,通过在编解码器UNet网络的跳跃连接中嵌入CBAM注意力模块,解决UNet网络特征提取能力较差,分割效果不好的问题。预训练分类模型VGG16去掉全连接层作为编码器,下采样提取特征;CBAM通过显式地建模通道和空间的相互依赖性重新校准编码器输出的特征图,达到了跨通道和空间提取图像特征的目的;解码器上采样特征图并且融合经过CBAM调整后的高质量特征图。通过和UNet的对比实验发现,CBAMUNet能够明显改善图像的分割效果,提高图像语义分割的精确度(PA)和平均交并比(m Io U)。(2)针对图像中较小目标在分割过程中容易丢失的问题,将UNet编码器的池化层替换为空洞卷积层,采用逐级递增空洞率的空洞卷积池化层代替标准池化层,减少池化操作导致的特征缺失。实验表明,上述方法提高了Cam Vid数据集上小目标的m Io U,改善了总体分割效果。(3)在(2)所述方法的基础上,提出了基于空洞卷积金字塔的图像语义分割模型Aspp UNet,通过级联不同空洞卷积系数的空洞卷积层构成空洞卷积金字塔模块,将该模块插入到UNet网络中解码器的后面,聚合多尺度特征图,实验表明,Aspp UNet模型针对不同尺寸的目标具有较好的分割效果,有效提升了分割的准确性。(4)针对分割目标边界不够清晰导致语义不明确的问题,提出了基于Seg Net WithCRFs的端到端网络模型,将具有高斯二元势(Gaussian Pairwise Potentials)和平均场估计(Mean-field Approximate Inference)的概率图模型条件随机场(Conditional Random Field,CRF)作为Seg Net网络的最后一层,使得该模型同时具有深度神经网络(Deep Convolutional Neural Networks,DCNN)和CRF的特性,充分考虑了特征,外观的一致性,并且在一个深度神经网络中,统一进行训练,避免了对图像进行单独的后处理,实验证明,Seg Net With CRFs模型能够使分割目标的边界更清晰,获取的图像语义信息更准确。本文提出的模型能够有效提高编解码器网络的特征提取能力,改善网络的分割效果,推动图像理解相关任务的发展,以及图像语义分割在自动驾驶和精准地图等方面的应用。
其他文献
2010年中共中央和国务院印发的《国家中长期教育改革和发展规划纲要(2010-2020)》、2014年教育部研制印发《关于全面深化课程改革落实立德树人根本任务的意见》以及2016年提出的《中国学生发展核心素养》等文件中,都对国际理解教育提出了一定的要求。本研究以小学三年级“小风筝·大世界”单元为个案,通过探索国际理解教育的基本理论,进行小学综合实践活动国际理解教育主题单元课程的开发。本研究共包括四
小学科学课程是一门以培养学生科学素养为宗旨的义务教育阶段的核心课程,在小学课程设置中与其他主要学科一样,具有十分重要的位置。但是,在课程教学过程中,小学科学面临诸多难题:1)小学科学课程是一门综合性课程,涵盖物质科学、生命科学、地球和宇宙科学,以及技术与工程四个领域,对任课教师的综合素质要求极高;2)小学科学课程是一门实践性课程,科学探究活动课程居多,课堂管理难度大;3)现有教师专任化程度不够,教
本文针对小学英语教学中重语言、轻文化教学的现状,选取彬州市Y小学作为研究对象,开展小学英语教学中文化意识培养情况研究,分析小学英语教学中文化意识培养现状和问题,并提出相应对策建议,期待能够为小学英语教学中改进和提升英语文化意识提供借鉴参考。本文在前人研究分析的基础上,对文化意识以及英语教学中的文化意识培养的概念进行界定,对语言与文化关系理论、跨文化交际学理论、克拉申“可理解的输入和“情感过滤假说”
当下的教学还存在以知识为本、灌输为主,停留在浅层学习上的现象。为适应教育改革的要求,落实立德树人根本任务,培养学生适应终身发展和社会发展需要的必备品格和关键能力,必须实施素养为本的教学。《普通高中化学课程标准(2017版)》将化学学科核心素养凝练为五个维度,“宏观辨识与微观探析”即为五个维度之一,具有鲜明的化学学科特点。调查发现,升入高三的学生其“宏观辨识与微观探析”素养仅达水平1和水平2,如何提
单元复习课作为化学学习的一种重要课型,目前教学中仍存在复习方式单一化、复习效率低下、学生的学习多处于浅层学习状态的现象。为迎合新时代培养创新型人才的要求、基础教育改革的需要和推动教育信息化发展的任务安排,单元复习课的教学应以深度学习理念为指导,转变传统的教学方式,不断促进学生由浅层学习向深度学习的转化。深度学习理念强调学生高阶思维能力的发展,迎合教育本质和时代发展要求,是落实核心素养的途径之一。因
当前教育信息化改革中,信息技术与学科教学的深度融合是教育改革的一个重要组成部分。整合技术的学科教学知识(TPACK)作为信息时代教师的必备知识框架,成为了学者们争相研究的热点。本研究首先以TPACK组成元素为理论框架编制调查问卷,对凯里市255名小学数学教师进行问卷调查,了解凯里市小学数学教师的TPACK的现状;其次,选取TPACK框架中技术元素(TK)以及与技术相关的三个元素(TCK、TPK、T
文本分类是自然语言处理领域中的一项基础任务,在舆情分析、邮件过滤、问答系统、智能信息推荐等应用场景中具有重要的意义。传统的文本分类方法需要分布均匀且标注完全的训练数据。而在实际应用中,随着互联网上的文本数据及资源爆发式增长,文本数据逐渐呈现出载体形式多样、标注数据匮乏、类别分布不均衡等特性,给传统的文本分类技术带来了巨大的挑战。针对文本数据类别分布不均衡和标注数据匮乏,导致文本分类精度低的问题,本
化学核心概念的教学在整个化学教学安排中占重要的地位,是学生学好化学知识的基础。高中化学教学的有效性是高中化学教师在新时期的重要研究课题,根据认知负荷理论改进和优化教学策略,能够促进学生的有效学习,从而在化学教学方面取得一定的进展。本研究着眼于将概念教学趋向模型化、课程内容教学趋向结构化,帮助学生“减压”、“减负”,提高教学的效率。首先通过问卷调查探明学生已有的认知结构和认知负荷现状,以及学习高中化
决策被定义为决策者面对不确定结果时,基于已有信息和经验产生多个备选方案,并对多个方案进行评估与选择的过程。有研究显示儿童的决策能力受到奖惩强化物的影响。金钱强化物与社会强化物对儿童决策的激励价值存在争议,导致这种差异的原因可能在于儿童的年龄和经济背景。农村留守儿童作为特殊群体,在不同强化反馈条件下,决策的心理加工可能有所不同。为了进一步探讨金钱奖惩和社会奖惩对农村留守儿童决策可能造成的差异。本研究
学生具备良好的归因分析不仅对其英语学习动机具有激发、定向与维持作用,还可间接培养其英语学习兴趣。学生在学习英语的过程之中,难免会审视自身的学习成败并进行相应的归因分析,但由于学生自行归因具有片面性和盲目性,会使其误入错误归因泥潭,影响其学习英语的消极情感,进而致使其英语学习兴趣低下。至此,亟需引导学生正确归因以有效培养提升学生的英语学习兴趣。但相比城镇小学,人力、物力、财力资源均短缺的乡村小规模学