基于3D-HEVC的深度视频快速编码研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:tiefer34
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维(Three-Dimensional,3D)视频系统因能提供更加真实的立体视频感知体验和支持用户自由选择观看角度,已成为视频编码和通信领域的研究热点。为了在解码端能提供立体视觉体验,与2D视频系统相比,3D视频系统需要传输更多的视频数据,给传输网络带来了极大的传输负担。因为深度视频表示场景到相机的距离远近信息,它最终用于辅助虚拟视点的绘制。在解码端利用基于深度图的绘制技术可以绘制出多个虚拟彩色视点。所以目前广泛采用多视点彩色加深度(Multiview Video Plus Depth,MVD)的3D场景表示方式,减少了3D视频传输所需要的数据量。与单视点彩色视频相比,MVD信号包括多个视点的彩色视频及对应的深度视频,除了具有时空域相关性之外还具有视点之间相关性。为了提高MVD信号的压缩效率,3D视频编码参考平台(Test Model of 3DHEVC,HTM)采用模式全遍历、四叉树递归分割、率失真优化、运动估计和视差估计等技术。深度图像一般是由大部分的平坦区域和少量尖锐边缘区域组成,编码特点与传统的彩色视频相比有很大不同。此外,深度图像的质量影响着绘制的虚拟视点彩色视频质量。因此,为了尽可能地提高深度视频的编码压缩效率和提高虚拟视点绘制质量,HTM还采用了深度模型模式、运动参数继承和基于虚拟视点失真的率失真优化准则等技术,这些技术的增加使得深度视频的编码复杂度远远大于彩色视频编码复杂度。因此,在保证高质量的虚拟视点和高压缩率条件下,提出低复杂度深度视频编码方法对于3D-HEVC的实时应用具有非常重大的意义。本文提出了三个创新的、有效的算法,主要包括:(1)提出了一种基于多类支持向量机的深度视频帧内编码快速算法。深度视频最大编码单元(Largest Coding Unit,LCU)的最优分割深度与空域相邻编码单元(Coding Unit,CU)的最优分割深度及当前LCU的空域复杂度有关。在离线训练阶段,利用空域相邻CU的最优分割深度及当前LCU的空域复杂度作为特征,当前LCU的最优分割深度作为标签,建立多类支持向量机模型。在预测阶段,通过模型得到LCU的最大分割深度,提前终止CU递归分割过程和模式决策过程。实验结果表明,与原始测试平台HTM-10.0相比,在基本不影响虚拟视点绘制质量和编码码率的条件下,本章提出的快速算法能平均节约35.91%的总体编码时间和40.04%的深度视频编码时间。(2)提出了一种基于贝叶斯理论的深度视频帧间编码快速算法。深度视频帧间编码条件下,当前LCU与时空域相邻LCU的最优分割深度具有很高的相关性。因此提出的算法利用时空域相邻LCU的最优分割深度作为特征,当前LCU的最优分割深度作为标签,离线训练得到贝叶斯模型。在预测时,利用当前LCU的时空域相邻LCU的最优分割深度作为模型输入,得到当前LCU的最大分割深度。在模式选取时,利用统计特性加速CU模式选择过程。实验结果表明,与原始测试平台HTM-10.0相比,在几乎不影响编码率失真性能和不降低虚拟视点质量的条件下,本章算法能平均节约65.03%的深度视频编码时间。(3)提出了一种基于运动一致性的深度视频帧间编码快速算法。深度视频与对应的彩色视频具有很高的结构与运动相似性。提出的算法首先利用彩色视频CU的运动矢量信息将彩色视频分为运动区域与静止区域。然后,当前深度视频编码帧与时域参考帧作帧差,得到前向和后向帧差图,再利用大津阈值算法将帧差图二值化分为深度视频静止区域和运动区域。最后,将当前深度视频编码帧分割为:深度和彩色视频都运动区域、深度和彩色视频都静止区域、深度视频运动但彩色视频静止区域、深度视频静止但彩色视频运动区域。当LCU属于不同的分割区域时,设置不同的编码策略。实验结果表明,与原始测试平台HTM-10.0相比,在保证虚拟视点绘制质量的情况下,本章算法能平均节约63.58%的深度视频编码时间和40.13%的总体编码时间,编码率失真性能平均提升2.78%。
其他文献
智能优化算法因其独特高效的运行机制在求解复杂工程优化问题中表现出明显的优势,已经成为了智能优化计算领域的研究热点。回溯搜索优化算法(Backtracking Search Optimizati
微细电火花加工具有非接触性、无需考虑材料硬度和可加工任何导电材料等特点,在特种加工领域得到了广泛应用。在微小孔加工等特殊加工环境下,传统电火花加工过程会因放电产物
由于干扰普遍存在于实际应用当中,因此干扰的抑制和抵消问题一直是控制工程领域研究的热点。近些年来,基于干扰观测器控制(DOBC)的理论受到学者们广泛关注和大量研究,并成功
新中国蒙古文报业是我国社会主义新闻事业的重要组成部分,因此在社会主义新闻事业发展过程中有着不可代替的地位。建国后中国共产党非常重视各民族的共同发展,不但着重发展了
锡林郭勒人民广播电台自1958年建立至今,已记载59年的光辉历史。在这59年间,锡林郭勒人民广播电台蒙古语广播在与时俱进的同时不断完善和加强改革。本文从新闻理论、媒介经营
在当前的国内公共安全领域中,基本上仍然采用纯手工的方式对刑侦现勘图像进行标注,这种方式不仅效率低下,并且带有强烈的主观性,针对这一现状,本文在阅读大量国内外参考文献
细分曲面技术具有传统参数曲面、隐式曲面造型技术不具备的诸多优点,因此广泛应用于计算机辅助几何设计和计算机动画造型等领域。但细分曲面的所有细分模式都存在一个亟待解
三维建模在目前的日常生活中使用广泛,例如在游戏、电影特效、城市和景观设计、建筑、虚拟遗产、虚拟环境等领域都有巨大的应用前景。基于序列图像对物体外貌进行三维建模,是
随着互联网以及无线通信的快速发展,各类移动设备迅速流行,人们对无线通信有了更高的要求,比如更高的带宽和更低的延迟,但移动通信质量容易受到干扰,会导致无线通信延迟的增
随着互联网日益渗透到社会生活的每个角落,经济发展也产生新的方式。2017年3月9日,国务院还发布了《关于大力推进大众创业万众创新若干政策措施的意见》,并在该《意见》中,肯