基于注意力循环网络的显著性检测方法研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:sheep1230_yuzt1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像是生活中常见的一种视觉载体,其重要信息蕴含于某些特定区域。人类视觉系统能够快速且准确地获取图像特定区域中具有价值的显著性信息。在实际应用中,研究者们希望显著性检测算法能够像人类视觉系统一样自动捕获图像中的显著性信息。目前,显著性目标检测已经成为计算机视觉领域的一个重要研究方向,被广泛应用于图像分割、目标跟踪、图像检索等研究领域,具有较高的实用价值。得益于深度卷积神经网络强大的特征提取能力和特征表达能力,基于深度学习的显著性检测方法性能比传统方法性能有了很大提升。但是在较为复杂的场景中,大多数显著性检测算法依然很难准确地检测出图像中的显著性目标,会出现显著性目标不完整、目标区域内部不连续或边缘模糊的情况。为了解决上述问题,本文对基于注意力机制和循环网络的显著性检测算法进行研究,主要研究内容分为以下两个方面:(1)深度神经网络的特征表达能力是显著性目标检测问题的关键,现有方法提取的卷积特征大多存在特征表达能力不强及缺乏辨识性的问题。为此,本文提出了一种基于多特征注意力循环网络的显著性目标检测方法。该方法中的多尺度特征提取模块利用四个不同感受野的空洞卷积获取高层的多尺度上下文特征,并使用聚合操作实现多尺度特征的融合。为使融合后的特征更具辨识性,采用注意力机制自适应地给每个特征位置增加权重以区分其重要性。在此基础上,利用循环网络微调显著性区域,使显著性区域更加完整,边缘更加精细,从而生成更准确的显著图。该方法在5个公开数据集上与8个新近方法进行了比较。实验结果表明,该方法生成的显著图更加准确,在MAE和F-measure评估标准上其性能也有进一步的提升。(2)由于全卷积网络能够提取丰富的多层级和多尺度特征,因而该网络在显著性目标检测任务中发挥着重要作用。但是,大多数基于全卷积网络的显著性检测模型以单一的方式利用多层级特征,生成的显著图不够准确。为了解决这个问题,我们提出了一种使用分层注意力特征循环引导神经网络的显著性目标检测方法。首先,将从全卷积网络中提取的多层级特征划分为低层特征和高层特征。使用具有不同感受野的空洞卷积从高层特征中提取多尺度特征,以获得丰富的上下文信息。同时,低层特征采用特征细化模块进行细化,用于补充卷积特征中的细节信息。由于分层特征的信息表示形式不同,其关注重点存在很大差异。因此,针对分层特征引入了两阶段注意力模块来引导显著图的生成。低层特征和高层特征融合后,模型注意力可能会出现偏差,从而导致检测到的显著性区域出现一定的偏差。为此,我们设计了一种循环引导网络来校正存在偏差的显著性区域,进而有效地抑制背景干扰并逐步细化显著性目标的边界。在前述的5个标准数据集上的实验结果表明,该方法在定量和定性评估中均表现出优异的性能。上述第一种方法仅利用高层特征中的语义信息而未考虑低层特征中的细节信息,并且其循环网络的中间过程并无引导机制,使得该方法对部分存在语义歧义图像的检测结果不够理想。第二种方法则在第一种方法的基础上,加强了对低层特征的利用,使卷积特征中的细节更加丰富。同时,我们设计了循环引导网络,使用真值图监督循环网络的训练过程,从而能够更为准确地检测大部分图像的显著性目标,具有较强的鲁棒性。本文主要研究注意力机制和循环网络在显著性检测领域的应用,为计算机视觉领域提供了两种可行的显著性检测模型,并通过实验证明了两者的有效性。
其他文献
近年来,随着我国经济社会各项事业的飞速发展,与之而来产生了大量的档案资料。如何对这些档案资料进行规范化管理和应用,已经成为亟需研究解决的问题。随着农村农业工作的多元化发展,乡镇街道等基层档案管理受到重视的同时,也面临一定的挑战。本文通过文献研究法、统计分析法、比较分析法,对济南市J区镇街档案管理规范化的现状进行了剖析,通过实地调研访谈、进行档案管理调查问卷等手段,结合具体概念理论,系统分析了济南市
随着“互联网+教育”的发展,大学生利用在线学习平台进行自主学习进入普及化阶段,但当前国内外主流在线学习平台数据显示,平台上的课程完成率不足10%,大学生自主学习的效果受到国内外各界越来越多的关注。为探究大学生自主学习效果较差的原因,本文通过爬取在线学习平台上的评论数据并使用文本分析方法对数据进行分析,得出学习资源是影响大学生自主学习效果的重要因素。通过分析当前主流在线学习平台上的学习资源,发现存在
随着大数据与人工智能时代的到来,算法推荐作为一种全新的新闻传播形式,逐渐在众多新传播技术中占据重要地位,成为现如今网络新闻的主流分发模式。当下,这种依据大数据分析用户画像的新闻推荐技术,能够满足受众对信息的个性化需求,也在技术与观念层面为新闻传播行业带来重大突破。但我国网络发展环境变化复杂,人们的利益诉求多样,随着算法推荐的应用与发展,“信息茧房”效应、“回音室”效应等相继出现,其延伸出来诸多负面
政务微博的产生和发展,促进了政府工作方式由对公众单方面监管转向与公众的相互交流监督。对政府部门来说,利用微博发布政务信息,可以帮助他们提升工作效率,了解公众需求,有针对性的开展工作,提高决策的科学性,提高工作透明度,提升社会形象。而政务微博发布的信息能够传播给广大粉丝用户,是这一切的基础。在微博平台中,信息依靠两种途径进行传播:粉丝关注和粉丝转发。关注的粉丝群是微博信息的第一批接收者,同时还是微博
心血管疾病非常常见,已经成为人类致死率最高的疾病之一。冠心病是主要的心血管疾病之一,其主要由冠状动脉疾病引起的心脏病。冠状动脉CT血管造影(Coronary Computed Tomography Angiography,CCTA)主要在冠心病临床诊断的早期筛查中使用。随着计算机辅助诊断技术的不断发展,诊断技术对CCTA图像的自动化处理及精度提出了更高的要求。本文以CCTA图像数据作为研究对象,从
显著性检测是计算机视觉领域非常重要的基础研究课题之一。在计算机视觉研究中,人类的视觉注意力机制对于理解图像或者视频中显著性物体起到重要的作用。通过人类的视觉注意机制可以在复杂的场景中相对准确且快速地发现和选择我们感兴趣的视觉目标。因此,如何更有效模拟人类视觉注意力机制高效提取显著性目标是当前计算机视觉非常重要的研究方向。随着深度学习在计算机视觉领域的广泛应用,众多不同的显著性检测方法涌现出来。虽然
待检测医学图像爆炸式增长,仅依靠人工识别的方式越来越难以快速、准确的检测图像中是否存在肿瘤。因此,医学图像处理技术迅速发展。在医学图像处理中,利用计算机快速准确地实现医学图像检测定位,能够帮助专家对病情更精确的掌控。其中,目标检测技术是一大重要组成部分。目标检测技术是对目标进行识别、检测目标行为的过程,每当符合检测要求的目标(如肿瘤)出现在图像中时,将其界定一个区域并预测其从属类别,从而快速准确的
随着计算机技术的迅速发展,图像成为了人们感知和认识世界的有效途径。但是由于图像在获取和传递过程中容易受到外界干扰而产生误差,让图像的后续处理变得很困难。因此,对于图像预处理(包括图像平滑、图像去噪、图像去模糊等)的研究尤为重要。其中,图像平滑的主要任务为:在平滑图像微小细节的同时保持图像的显著结构。图像去模糊的主要任务为:将模糊图像复原为清晰图像。目前,图像平滑和图像去模糊方法仍然存在图像边缘无法
随着近年来三维计算机图形学的快速发展,三维面部表情迁移技术得到了众多学者的关注。目前,该技术已广泛应用于计算机动画、影视特效、虚拟交互、远程网络会议等领域。三维面部表情迁移技术可以有效地避免动画师为新模型制作表情动画序列的繁琐工作,提高现有表情动画的复用率和新动画的合成效率,为高真实感表情动画的合成提供了新的途径和方式。一个好的三维面部表情迁移技术必须满足三个主要指标:表情迁移过程不需要人工干预;
在高速发展的数字化时代,数字图像早已成为视觉信息的主要传输媒介,人们对其质量的要求也逐渐提高。因此,近年来数字图像处理技术,特别是图像增强技术得到迅速发展,在多个领域得到广泛应用。例如,为了使视频更加流畅,需要对视频进行补帧以提高帧率,从而满足人眼视觉暂留特性的需要;为了分析大气和地面状况,需要对遥感卫星图像进行放大去模糊处理;为了侦破案件,需要对监控影像进行高分辨处理;为了更准确地定位病灶,需要