论文部分内容阅读
近年来,随着立体显示和交互式多媒体技术的迅速发展,传统的二维视频已经无法满足人们的视觉需求,而是渴望能够更加逼真记录自然场景的形色兼具的显示视频。三维显示视频逐步进入观众的视线。三维显示视频,顾名思义,就是对于给定场景可以提供深度感知的一组信号集合。多视点加深度立体视频,作为三维显示视频的主流数据格式,成为当下立体视频领域的研究热点。多视点加深度立体视频格式由多路视频及其相应的深度图序列组成,其数据量通常几倍于传统的二维视频,再加上采集的视频分辨率越来越大,数据量进一步激增。庞大的视频数据量,难以实现存储和传输的要求,迫切需要高效的压缩编码技术来减少数据量。2013年,新一代高效视频编码标准(High Efficiency Video Coding,HEVC)问世,并针对多视点加深度立体视频进行编码扩展,拟形成基于HEVC的3D视频编码标准(3D-HEVC)。顺应时代发展需求,本论文针对3D-HEVC标准中的预测技术开展研究,预测是立体视频编码中的关键环节,预测的好坏直接影响着传输数据量和最终的显示视频质量,本文研究具有重要的应用价值和现实意义。从提升编码效率、降低编码复杂度以及增强编码处理能力的角度出发,本文的主要创新点和贡献包括以下几个方面:1.深度图预测:3D-HEVC标准深度建模模式中分区常数值预测的参考像素选择没有很好地考虑深度图边界特性。针对该问题,结合物体实际的边界信息,本文提出一种改进型的分区常数值预测算法。同时,考虑空域边缘相似性,给出一种增强型的Contour分割算法。2.视点间预测:3D-HEVC标准Sub-PU级视点间运动矢量预测技术中空洞填补算法无法流水线(pipeline)执行和并行处理,严重影响算法的工程应用价值。针对此问题,本文提出四种空洞填补方案实现pipeline执行和并行处理。3.纹理图预测:3D-HEVC标准基于深度的块分区帧间预测技术中分区推导过程与分段mask过程存在很大的冗余性。针对这一点,本文提出一种改进型的分区推导算法,巧妙地利用分段mask过程获取的mask值信息简化分区推导过程,消除内在的过程冗余。