基于深度学习的单幅图像超分辨研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:lslandgp1972
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像超分辨重建是计算机视觉研究一个重要的方向,在现实生活中可以应用在许多领域。在实际工作或者日常生活中因为设备成本、技术限制、网络限制等因素常常不能得到足够清晰的图像。如果单纯的依靠提升硬件设备不仅成本耗费非常大,而且有些情况下会难以实施,比如人体医学成像中会受到人体组织的干扰。因此,对图像的超分辨处理在某些时候就显得尤为重要。图像超分辨重建的技术已经应用在很多领域,如医学成像、遥感成像及监控视频等方面。基于传统方法的超分辨技术得到的图像细节信息不够完善,在视觉效果上也比较让人难以接受。近几年来,基于深度学习的超分辨重建技术在对图像的处理上有着很好的成效,但是依然存在着一些问题,比如重建后纹理部分的噪声问题依然存在。在此基础上,本文将对深度学习中的基于生成式对抗网络的超分辨技术进行研究,围绕这一主要的框架模型,本文的主要工作如下:
  (1)分析现有的卷积神经网络和生成式对抗网络的模型和训练方法,神经网络在图像处理方面的优势以及仍存在的问题。例如在提取图像特征时对于所有的特征映射都是统一的,图像的信息比较混杂,这样可能会造成重建后的图像在某些区域产生一定的偏差或者噪声。针对这一现象利用目前提出的比较新颖的方法进行研究,比如在原有结构中引入倍频程卷积(Octave Convolution)代替原有的卷积层来进行卷积操作,将图像中高低频率的信息分开处理,优化网络对细节、纹理的处理方法。
  (2)改进特征提取网络和感知损失。在原本的单个预训练的VGG19模型上加入针对当前数据集的特征提取网络,使得原本的特征提取更具有针对性,同时提高泛化性能。
  (3)研究新的激活函数和优化算法。原本的超分辨模型所使用的基本上是传统的激活函数和优化算法,比如ReLU家族。最近几年来,研究者们一直对此进行着不懈的研究改进,在此基础上,本文测试性地研究了深度学习领域新提出的几种激活函数和优化算法,比如Swish和Mish激活函数,Ranger和Novograd优化算法等,进行对照组实验,对比它们的效果。
  (4)将本文实践可行的改进想法用于图像超分辨重建实验,对比原有的模型的效果来验证改进后的模型的有效性。在通用测试集Set5和Set14上进行实验得出结果对比,使用客观性的指标PSNR和SSIM进行评价,展示图像重建的视觉效果,实验的结论能够验证改进的生成式对抗网络可以很好的处理图像超分辨重建的问题。
其他文献
近些年来,随着分数阶微积分理论的飞速发展,以及在实际的物理系统中越来越多的应用,分数阶系统的相关研究也成为了一个较为热门的方向。分数阶微积分作为整数阶微积分的推广,对一些复杂系统可以有更简洁的描述,并且分数阶微积分的引入可以增加控制器设计的自由度,改善控制品质。然而,在系统实际运行过程中,环境的变化、系统器件的磨损等原因会使得所建系统模型不再精确,也可能降低系统的可控性甚至导致系统处于不稳定状态。
火工品是内部装有火药的一次性使用装置,当其受到外界刺激时,会引发内部火药发生燃烧或者爆炸,从而输出能量完成起爆工作。作为先进军事武器系统的第一能源产品,火工品的安全性、可靠性和先进性与武器弹药系统的安全性、可靠性和先进性紧密相接。火工品性能由火工品参数进行表征,针对火工品参数对外界环境敏感,导致对于参数的获取及测量准确性变差这一问题,本文采用Volterra模型与在线参数辨识算法相结合的思想对火工
学位
近年来,人体行为识别技术广泛应用于视频监控、智能医疗教育、无人驾驶、日常行为分析等方面,在安防领域扮演着举足轻重的角色。军事上,行为识别技术已应用于军事化研究基地、国防边境、哨所等戒备森严的军事重地,通过检测区域内可疑行为,为环境感知及决策者远程决策做出贡献。  尽管基于深度学习的人体行为识别技术已取得了很多成果,但仍存在基于RGB视频的模型严重依赖物体和场景、行为特征表达不够合理等问题。针对上述
随着化石燃料的日益消耗和环境污染的加重,能源结构逐渐发生改变,新能源所占的比重逐年上升。并网逆变器是新能源电力系统的重要环节,作为新能源电力的并网接口,其地位和作用十分显著。并网逆变器工作稳定性除受自身因素作用外,还受来自电网干扰的影响,电网电压的平衡状况、谐波含量会对逆变器输出波形质量造成影响。如何使并网逆变器在电网情况较为恶劣的条件下,仍能安全高效的运行,成为现阶段研究热点。本文以三相并网逆变
如今,全球的能源需求和发展已逐步向可再生能源转型,并将成为最终目标。因此,风能作为清洁可再生能源的重要代表,风电产业得到了飞速发展,变桨距风机已经成为风电机组中主力机型。变桨系统通过改变风力机叶片的桨距角,提升风能的利用率和输出功率。由于风机变桨系统的执行器故障发生频繁,故而,对变桨系统执行器故障诊断和容错控制的研究对提升风机运行的可靠性和降低发电成本有着重要意义。  本文以风电机组变桨系统为主要
学位
火灾作为破坏性非常大的灾害之一,每年都会对经济和环境造成巨大损失。因此,及早发现火灾并进行预警对火灾防治具有至关重要的作用。目前火灾识别的方法已经从传统传感器探测演变为图像型火灾的研究,但仍存在特征选取盲目和识别率低的问题。针对此问题,本文重点研究基于深度学习的火灾识别方法,主要研究内容与创新点归纳为以下几个方面:  (1)深度神经网络模型的相关研究  对全连接神经网络和卷积神经网络的结构和算法进
学位
脑卒中是一种急性脑血管疾病,是由于脑血管破裂而引起脑组织损伤,目前已成为我国成年人致残的首要原因,近些年来发病率一直在逐年递增。一半以上的脑卒中患者会有上肢偏瘫的后遗症,上肢无法自主活动,严重影响日常生活。现阶段,长期的康复训练是治疗脑卒中患者上肢偏瘫最好的方式,临床上对患者训练的评估主要依靠医师的个人经验。在没有康复治疗师现场指导的情况下,使用轻量、高效、可靠的计算机系统对患者上肢康复训练进行评
学位
文字是人类交流信息的工具,是简单的视觉图案再现口语所表达的形式。随着深度学习技术的不断发展,自然场景文本检测技术已经成为计算机视觉与模型识别等领域的重要研究课题之一。本文针对自然场景下的文本检测问题进行了研究,不同于传统的光学字符识别技术所识别的文本图片,自然场景图像中的文本在外观上,具有字符大小不统一、文本方向不确定、背景复杂等特点,使得检测难度较大,也为后续的识别过程带来不必要的麻烦。针对自然
学位
随着大数据时代的来临,越来越多的应用程序应运而生。为了提升用户的使用体验,增大用户黏性,个性化推荐算法成了各大应用程序寸土必争的领域。目前主流的个性化推荐算法大部分是通过用户以往对于产品的评分来研究用户的喜好,进而向用户提供推荐列表。然而,目前面临的难题是网络上用户评分过于集中,评分可信度不高,导致推荐算法的推荐准确率并不理想。  网络信息越来越丰富,能体现用户情感的信息也越来越多,除了用户的评分
传统金融行业中各类型数据丰富,蕴藏着巨大价值,如何有效地使用这些数据并从中提取有用信息,帮助用户进行决策,是目前金融业内人士面临的一大问题。而构建金融领域的知识图谱可作为该领域语义理解及搜索的关键技术,为以后金融领域的文本分析、数据挖掘、决策推理等提供有力支撑。  知识图谱是2012年Google公司提出的一个新概念,是一种用图模型来描述知识和建模世界万物之间的联系的技术方法。知识图谱由节点和边组
学位