基于空时特征增强的图像视频超分辨率重构算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:JK0803_sunmingfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超分辨率重构旨在从遭受了模糊、噪声以及降采样的低质图像或视频中恢复出对应的高质量图像或视频,目前已大量应用在医学图像处理、视频监控及卫星遥感等领域。作为经典的不适定问题,针对图像重构时难以准确地恢复出纹理信息、视频重构中存在运动模糊和跳变现象的问题,已经提出了很多模型,重构性能得到了不同程度的改善。其中,相较于传统算法,基于深度学习的方法以其强大的非线性表达能力而有更好的表现,但纹理的重构效果仍有待提高。因此,本文以图像和视频为研究对象,分别提出了图像、视频超分辨率重构算法。主要内容如下:本文首先研究了图像超分辨率重构算法。现有的模型要么利用单一尺度特征,要么对多个尺度的特征采用级联的方式提取深度特征,没有利用或者未充分利用高、低分辨率之间的相互依赖关系,为此,本文应用空间特征增强,提出了基于多分支多分辨率交叉投影的图像超分辨率重构算法。该模型具有多个分辨率不同的并行分支,以交叉投影的方式交换信息,并以注意单元自适应地学习通道和空间位置的重要性;为了巩固细节恢复,还根据模型特点定制了损失函数。最终,模型以14.2M参数做到了较高质量的重构,在5个常用测试集上均有较好的PSNR/SSIM得分;视觉感知上,该模型能有效抑制伪影和混叠,生成更清晰的边缘。本文第二个贡献是提出了一个视频时空超分辨率重构模型。现有算法中,二阶段方案的时间超分辨率过程和空间超分辨率过程缺乏关联性;对于一阶段方法,关键问题在于如何保证插入的中间帧特征符合真实运动,以及如何利用帧间相关性和时空的长期依赖关系,为此,本文提出了基于双向对齐和时空修正的视频时空超分辨率重构算法。模型充分利用时空信息,通过双向对齐为相邻帧插入缺失的中间帧特征;在基于时空信息的特征提取与融合模块中利用时空修正方案校正特征,并通过多个残差块提取深度特征。最终,模型以20.32M参数在4个不同场景上均能稳健运行,与当前的主流方法比较,都获得了最佳的定量评估结果,尤其在快速运动测试集Vimeo-Fast上,PSNR值为37.25d B,较次优模型提升了0.21d B;从视觉上,本模型重构出的高帧率高分辨率视频也更自然。
其他文献
智能监控系统中的视频异常检测技术旨在自主检测出监控画面中的异常事件,有利于维护社会公共安全,具有较高的学术价值和工业价值,也是当前计算机视觉领域的研究热点之一。影响视频异常检测算法精度的主要因素包含事件的时空特征学习和异常评估两个部分,本文将从这两个方面着手研究,以实现事件的完备描述,增强异常事件的可分辨性,进而提高异常检测精度,主要内容包括:(1)针对基于深度学习的帧重构模型泛化能力过强而无法保
学位
随着下一代网络多媒体化发展,业务呈现出爆炸式增长特性,仅凭现有地面网络架构与物理层技术难以产生真正的通信技术变革以满足日益增加的网络业务承载,且地面网络弱覆盖以及系统高能耗等问题亟待解决。本文从6G网络实现泛在连接和高能效两大目标出发,构建了兼具穿透和反射的可重构智能表面(STAR-RIS)辅助的空天地一体化网络架构,其中STAR-RIS能进一步扩展空天地一体化网络服务范围,从而满足山地等复杂场景
学位
在万物互联的时代,无线通信技术的高速发展极大地方便了人们的工作与生活。但受限于地理等因素,现有的地面网络仍无法满足全球日益增长的通信需求,由此卫星通信技术开始受到业内人士的青睐。然而,卫星波束宽广的覆盖范围和无线电信号的广播特性使得卫星系统更容易受到不法分子的恶意攻击。考虑到无线环境的高度开放性与计算机运算能力的不断提升,仅依靠加密手段可能不足以保证无线通信系统的安全。因此论文围绕星地通信网络中的
学位
在新兴物联网应用的驱动下,越来越多的设备接入物联网,大量数据涌入数据融合中心等待处理,而数据的保真度和时效性就显得至关重要。作为物联网中典型的数据驱动应用,无线传感器网络由多个在空间上分布的传感器和数据融合中心组成。传感器负责采集数据,数据融合中心负责处理数据并将数据交付给使用者。在该网络中,同时追求新鲜度和保真度成为了一大挑战。事实上,无线传感器网络的部署方式发挥着不可小觑的作用,恰当的部署方式
学位
危险驾驶行为中,疲劳驾驶和分心驾驶是导致道路交通事故发生的主要原因。对危险驾驶行为进行检测并及时预警,可以有效降低道路交通事故的发生率,保障人民的生命与财产安全。因此,面向危险驾驶行为检测方法的研究成为近年的一大研究热点,并取得了较好的效果。但在资源有限的边缘端设备上,危险驾驶行为检测方法面临着光照环境适应性不强和准确率低等挑战。论文面向以上挑战,开展对于不同光照环境具有良好适应性的高效危险驾驶行
学位
图像作为记录和呈现信息的重要载体,被广泛应用于人类日常生活。高质量图像呈现出的信息和纹理更加丰富。然而,受成像系统和拍摄环境等因素的限制,获取的图像的分辨率有时很难满足实际需求,从软件技术出发提升图像分辨率的超分辨率重建技术由此产生。随着硬件设施性能的提升和深度学习技术的发展,基于深度学习的图像超分辨率重建被各界学者广泛关注。本文针对目前基于深度学习的图像超分辨率重建方法存在的不足,结合注意力机制
学位
随着物联网(Internet of Things,Io T)技术的快速发展和广泛应用,海量数据接入、并发设备连接以及对实时性等有更高要求的新兴应用给现有的移动通信网络带来了严峻挑战。移动边缘计算(Mobile Edge Computing,MEC)将资源下沉到网络边缘,靠近用户,可以增强终端处理能力,降低任务处理时延。然而,传统的MEC受限于固定部署,在一些特殊应用场景存在局限性,搭载边缘服务器的
学位
工业互联网将工业控制,计算机应用,通信网络紧密融合,可实现工业业务的垂直化部署。三者融合需实现模型表达的准确性,功能描述的一致性以及参数的有效传递能力。例如在工业控制业务部署时,通过Apache对业务部署逻辑的一致性进行冲突检测。同样在5G中虚拟网络功能(Virtualized Network Function,VNF)的部署时,需对计算机进程之间的冲突进行检测以及解决VNF之间对共享资源的竞争问
学位
行人重识别在视频监控、智慧侦察、公共安全等领域有广泛的实用价值与研究意义。由于现实场景中存在不平衡的光线、身体部位的遮挡、人的姿势变化等复杂因素,使行人重识别任务变得很具挑战性。主流方法往往单独利用卷积神经网络(Convolutional Neural Networks,CNN)或者Transformer提取行人的关键信息,如何将Transformer和CNN有机地结合来完成行人重识别任务是目前研
学位
电子鼻是一种用于气味检测的仿生系统,主要由气体传感器阵列以及模式识别算法构成。在连续工作的在线场景中,由于环境因素的影响,混合气味干扰和传感器漂移成为损害电子鼻识别性能的两个主要原因。一方面,电子鼻工作时难免受到其他混合气味的干扰,无法准确地识别出目标气味。另一方面,漂移校正是电子鼻在线工作中不可或缺的环节,而基于机器学习的漂移校正手段越来越受欢迎。其中,主动学习漂移校正方法被看作是一种适合电子鼻
学位