基于深度学习的自然图像抠图算法

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:yxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字图像抠图是当前计算机视觉的热门研究问题之一,其广泛应用于电脑特效制作、电影电视作品创作等领域。图像抠图的本质是图像的软分割,旨在提取图片、视频流中创作者感兴趣的前景物体,并将其同背景剥离和目标背景进行融合,从而获得新的具有视觉冲击力的图片或视频流。电影工业上常用绿幕来辅助抠图,但在自然图像中,如何精确地提取前景物体成为了当前研究的重难点。目标物体边缘的细节信息,包括动物的毛发、半透明的物件、颜色相近的物体、模糊的轮廓都会不同程度地影响图像抠图精度。为了解决当前难以提升的自然图像抠图精度问题,本文在研究了传统的根据传播和颜色采样的抠图方法基础之上,提出了一个基于深度神经网络的自然图像抠图算法,主要内容如下:研究了经典卷积神经网络的各个组成部分,并以Res Net网络为骨干进行改进,不同于当前图像分割领域常用的单次编码解码网络,本文网络在此基础上采用了从原始图像中获取的多尺度图像特征,结合通道域的注意力机制,学习低层次图像空间及外观信息,提出了基于多尺度通道注意力的抠图网络。此外为了增加网络深度,运用多次编码解码结构的特征复用网络传递高级不透明度特征信息,扩大了卷积核上的感受野。该方法能够提高空间精度,加强网络语义信息的获取能力。同时在采样过程中加入特征密集连接模块,将同层级的编码解码特征信息高效传递和复用,加强了网络提取非近邻特征的能力,构成特征复用结构的卷积神经抠图网络。本文网络在公开数据集上进行了训练和测试,验证了文章提出的不同模块抠图效果及有效性。与基准网络相比,实验结果显示本文提出的抠图算法可以达到较高的精度,在Adobe数据集上以均方误差MSE为标准的测试结果比Deep Image Matting方法提高25.7%,达到了提升抠图精度的预期效果。
其他文献
在实际生产生活中,人们更多地希望能够拍摄出更加清晰真实的照片,但是由于光线原因导致相机过度曝光,为了解决这一难题,提出使用超表面实现点扩散函数以及卷积神经网络来实现过曝光场景下的超分辨率成像。与此同时,不可或缺的是具有高分辨率,小焦斑的光学镜片。超表面(Metasurface)是指一种厚度小于波长的人工二维层状材料,在亚波长尺度中,能够灵活的有效调控电磁波的振幅、偏振、传播、相位等。并且其尺寸能够
当今时代,随着人工智能技术的发展,人机交互康复机器人在医疗领域方面的应用越来越广泛。相关研究表明,在面向脑卒中患者的康复治疗中,患者极易受到心理情绪方面的干扰,影响康复机器人对患者进行康复训练,因此,在心理层面上,开展患者主动进行康复训练的研究十分迫切。本文在生理信号分析的基础上开展情绪识别及其在手功能康复训练中的相关研究。以兴奋、烦躁、轻松为目标情绪,利用人体肌电和心电生理信号,研究一种基于生理
随着社会快速发展,互联网规模越来越庞大,多元化的网络应用类型层出不穷。技术的发展和应用种类的繁多满足了人们全方位的需求,同时也给网络的管理与维护带来了巨大挑战。准确高效地对网络流量进行分类是网络管理中的关键环节。由于用户更加注重数据隐私,以及加密算法的多样性与复杂性,造成了网络流量识别的困难。然而传统的流量识别模型和方法不能很好满足当前复杂场景的需求,研究探讨新的流量识别模型和方法具有重要的现实意
集成学习是现在非常流行的机器学习算法。目前,集成学习算法在许多著名的机器学习比赛中取得了很好的成绩。集成学习算法通过组建和联合多个机器学习算法来完成特定学习任务,业内它常被称为多分类器系统或基于委员会的学习,其常比单一学习器具有显著优越性。而且集成学习算法在金融市场的应用领域非常广泛,具体包括预测股票市场走势,预判金融市场风险,构建投资股市方案,处理大量高维抽象的信息等应用领域。投票集成学习算法属
长江口水下三角洲位于海陆交汇处,水动力环境复杂,且长江流域内输沙量年际变化,从而导致不同柱样间的沉积速率、粒度及磁性特征上具有明显的空间差异。本文选取长江口水下三角洲前缘斜坡(20 m等深线附近)2个柱样,运用210Pb、137Cs放射性比活度测年、环境磁学、粒度实验等方法,构建柱样的沉积序列,并讨论沉积物年龄、粒度对沉积物磁学特征的影响。再将研究结果与前人研究进行对比分析,得出不同柱样间沉积速率
本文对中美两国教材中“指数函数”相关习题进行数学认知层次比较研究,旨在为我国教材编写提供参考。首先,比较中美数学课程标准。接着在文献综述基础上建构数学认知层次框架:层次-1:计算——操作性记忆层次,层次-2:概念——概念性记忆层次,层次3:领会——说明性理解层次,层次4:分析——探究性理解层次,最后,将两版本习题根据数学认知层次框架分类并进行比较分析。研究得到:(1)人教版以符号表征方式为主,加州
利用人脸属性进行身份验证是最直接方便的手段,每个人的容貌随着年龄的变化会出现一定程度的改变,进而对人脸识别结果产生影响,因此人脸蕴含的大量年龄信息是识别个体的重要依据。与人脸图像分析相关的年龄估计、人脸老化合成研究是当下的热点问题,它们可以应用在很多重要的领域,如刑侦、数字娱乐等。随着社会的发展,各式各样以年龄为基础的人机交互信息系统持续改进升级,年龄估计与人脸老化合成技术在不断进步的过程中仍存在
近年来,人口老龄化趋势加速使得全球医疗体系面临人力不足的严峻问题,2020年爆发的新冠疫情更是加剧了全世界高效率医疗资源的稀缺程度,利用人工智能来缓解医疗资源紧张的需求变得越来越迫切。目前少有结合了表情识别和边缘计算的病房监控研究方案,本文针对这个现状,以及轻量化卷积神经网络的表情识别准确率不足问题,展开了以下几方面的深入研究工作:1.对传统轻量化卷积神经网络Xception进行改进研究,提出了改
随着智能终端的普及,各个应用领域对无线网络的需求急剧增加,新一代5G移动通信系统成为了全球移动通信领域的研究热点。作为面向5G关键技术的非正交多址接入技术,是一种利用了频域、时域、功率域的新型多址方案,该技术允许多个用户在同一个子信道内同时传输数据,在接收端采用串行干扰消除技术消除用户间的干扰,进而显著提升了系统的频谱效率和能量效率。研究非正交多址接入系统的用户功率分配方案对新移动通信系统的实现具
2020年春,全球爆发新冠肺炎疫情。根据联合国教科文组织的统计,全世界大约有143个国家,全国性的关停了学校,近11.84亿学习者受到了影响,其中67.7%以上是在校学生。突发的疫情,将教与学的主阵地,从实体课堂转移到了线上,瞬间触发了全球性的大规模在线教学的实战。我国各省市纷纷出台政策,推动各级各类在线教学的广泛开展,也给广学大一线教师教学方式带来了极大的挑战,如何顺利开展在线教学,提升在线教学