【摘 要】
:
超分辨率重建的目标是从低分辨率图像/视频恢复出相应的高分辨率图像/视频。作为典型的计算机视觉问题,超分辨率重建已经被研究了数十年。近年来,高清显示器的普及推动了视频
论文部分内容阅读
超分辨率重建的目标是从低分辨率图像/视频恢复出相应的高分辨率图像/视频。作为典型的计算机视觉问题,超分辨率重建已经被研究了数十年。近年来,高清显示器的普及推动了视频超分辨率的发展。本文重点研究基于深度学习的视频超分辨率方法,提出了引入注意力机制的深浅层结合的视频超分辨率网络ADS-VSR和融合高分辨率光流估计的改进的视频超分辨率网络OFE&ADS-VSR。本文的主要工作体现在以下三个方面:(1)学习和研究了具有代表性的单帧图像和视频的超分辨率重建方法,以及基于光流的运动估计方法,并分别数值实现和对比分析了几种具有代表性的方法。(2)提出引入注意力机制的深浅层结合的视频超分辨率网络ADS-VSR,并将其应用于视频超分辨率重建。ADS-VSR网络由重建视频帧基本信息的浅层网络和重建高频细节信息的较深层网络,以及基于注意力机制构造的Attention模块组成。联合训练ADS-VSR网络能够有效提高模型的拟合能力和收敛速度。采用ADS-VSR网络进行视频超分辨率重建的过程为:首先采用局部/全局平滑性假设和全变分正则化约束的光流估计方法以及自适应运动补偿方法对低分辨率视频帧进行运动估计和补偿;然后将补偿过的低分辨率视频帧送入ADS-VSR网络输出高分辨率视频帧。实验结果表明,ADS-VSR网络重建的视频包含更丰富的细节信息并获得较好的视觉质量。(3)提出融合高分辨率光流估计的改进的视频超分辨率网络OFE&ADS-VSR,实现了端到端的视频超分辨率重建。OFE&ADS-VSR网络具有两方面的特点:a)基于金字塔结构的光流估计网络OFE,对输入的低分辨率视频帧采用从粗到细的方式估计对应的高分辨率视频帧之间潜在的高分辨率光流;b)采用后上采样模式的ADS-VSR网络,有效提高网络训练效率。通过端到端的OFE&ADS-VSR网络实现视频超分辨率的过程可以概括为三个阶段:I)将低分辨率视频帧送入OFE网络获得高分辨率光流,并利用空间到深度的转换建立起高分辨率光流和低分辨率视频帧之间的联系,生成相对应的低分辨率光流集合;II)依次利用低分辨率光流集合中的光流值对相邻帧做运动补偿,并将补偿后的多张低分辨率相邻帧和待超分的中心帧组合成低分辨率草稿集;III)把低分辨率草稿集送入后上采样模式的ADS-VSR网络,输出待超分的中心帧的高分辨率结果。大量实验结果表明,OFE&ADS-VSR网络可以进一步提高视频重建质量。通过在Vid4、Harmonic-8和SPMC-11测试集上的定量和定性比较可得出,本文方法的重建结果更逼近真实的高分辨率视频帧,包含的细节信息更丰富,给人的视觉感受更良好。
其他文献
朝鲜族作为一个跨境民族,其族群认同意识一直受到学界以及社会的关注。由于自身特殊的历史经历,朝鲜族族群认同意识一直处于一种变化发展之中。一直以来,对于朝鲜族的族群认同的研究多从现代化背景下的跨国流动入手,探究朝鲜族族群认同的动态变化,甚少有从朝鲜族自身内部切入来研究其族群认同的稳定性。本文从朝鲜族曾经赖以生存的水稻种植这一角度切入,对我国东北地区某朝鲜族村落进行田野调查,探讨水稻种植在维系朝鲜族族群
脑机接口技术旨在研究、定位、辅助、增强和修复人类的认知或感觉-运动功能,为运动功能损失的患者带来了新的治疗方式,对脑科学领域的研究有着重要的意义,并且在医疗、娱乐、
目的:运用CBCT(Cone-beam computed tomography,锥形束计算机断层扫描)对内蒙古包头地区成年人左右上颌第一磨牙的根管形态进行测量,了解该地区上颌第一磨牙的解剖学形态,为临床上进行桩的预备及成品桩的研发提供一定的数据支持。方法:选取74名因各种病因来内蒙古医科大学第三附属医院口腔科就诊需拍摄CBCT汉族患者的120颗上颌第一磨牙,其中左侧55颗,右侧65颗;男性40名,
随着计算机技术,生物医学设备,人机接口和电子皮肤设备等广泛应用,压力感测领域迅速发展。石墨烯在过去几年中一直主导着2D材料的研究领域,成为最有前途的2D材料。Yury Gogot
随着IEEE 802.11标准的推广,无线网络在室内环境的覆盖率逐年增加,由此带来了新的可探索空间——基于无线局域网(WiFi,Wireless Fidelity)信号的特征提取感知室内空间中的变化,例如室内人员入侵检测、呼吸检测、心率检测等。利用WiFi信号进行室内定位的研究也成为近年来研究的热门。一些基于室内定位的服务也逐渐应运而生,如学校或公司里的签到系统、商场里利用公共WiFi在商铺附近投
作为下一代云计算系统的发展趋势,移动边缘计算(Mobile Edge Computing,MEC)能够在网络边缘就近地提供高带宽、低时延的“边缘云”服务,弥补了移动云计算的不足。其中,用户委
图像超分辨率重构是指是根据输入的一幅或者多幅低分辨率图像来重构高分辨率图像。高分辨率图像通常包含更加丰富的信息,在满足人类对视觉效果需求的同时,也为图像处理中其他
目的:通过神经行为学检查Longa评分以及microPET-CT评估人脐血神经干细胞(human cord blood neural stem cells,HUCB-NSCs)经过动脉移植途径治疗脑出血大鼠的效果,并且探讨其可能的治疗机制。方法:选取健康成年的Wistar大鼠,采用二次注血/退针法制作大鼠脑出血的模型,造模成功的大鼠进行随机分组---实验组及对照组。实验组大鼠经左心室移植人脐血神经
随着图像处理和深度学习理论与技术的快速发展,视频监控系统得到了越来越广泛的应用,因此也产生了大量的数据,但是目前这些数据并没有得到充分有效的利用,因此造成了巨大的资源浪费。为了提高这些资源的应用效率和水平,本文立足于监控视频,开展了基于深度学习理论和方法的行人重识别研究,这对于增强现有的视频监控系统的性能,具有重要的理论意义和实际价值。行人重识别是指利用计算机判断出现在不同摄像机中的行人是否属于同
双向光纤网环是光纤通信网络的重要组成结构。在通信网络中,该结构可以有效避免线路故障。根据通信环的几何特性,节点间的需求可选择顺时针与逆时针两个方向传送。一个好的路由方案可以降低网络负荷,提高现有资源的利用率,由此产生了环负载均衡问题。给定一个环R=(V,E)及点对集合U,每个点对间有一个流量需求,将这些点对通过环上的顺时针路或逆时针路连接起来,环上连接边的负载为通过该连接边的点对流量需求之和,目标