论文部分内容阅读
现有的视频编码技术如H.264、MPEG-4 以及AVS等已经实现了对视频信息极大程度的压缩,以适应低码率数据传输的需求。即便如此,对视频信号的进一步压缩仍旧是技术人员关注的热点。
现有的视频编码技术往往着眼于消除最主要的空间冗余、时间冗余以及信息熵冗余。这样的技术往往会受到香农极限的约束,逐渐走向性能的瓶颈。因此,从非统计学冗余的角度来看待视频编码问题,才不失为新一代视频编码技术的重大革新。
考虑到视频信息中存在大量的视觉冗余,这些冗余无法用现有的编码手段进行消除,同时人眼作为视频的最终受体并不关注这样的冗余。消除此类冗余时,我们尝试将主观视觉感知的概念引入到现有的视频编码算法中,设计出全新的视频编码系统架构。该架构使得在保持一定主观质量的基础上,进一步地减小码流,提高视频的压缩能力。
在本系统的设计中,我们认为典型的视频帧可以被理解成为非纹理区域与纹理区域的集合。而由于纹理区域具有较强的自相似性的同时,较之于非纹理区域内的前景,往往不会引起人眼的关注。因此,我们尝试在传统编码的基础上,舍去部分纹理块/宏块不传,仅发送非纹理区域和少量纹理样本,以减小码流速率。相应地,需要设计具有纹理合成能力的重建过程以实现对当前帧的正确重建,以便后续帧的帧间预测。
同样,在解码端的设计中,我们设计算法实现对非纹理区域及纹理样本的正确接收与管理,然后采用与重建过程相同的纹理合成算法,实现解码端的正确输出。
考虑到纹理合成算法需要同时应用于编码端重建过程和解码端中,因此,我们采用了较为简单的预测匹配算法来实现合成。相对于较复杂的预测匹配算法,此算法更具有鲁棒性,只需要最小幅度地修改码流,就可以保证正确地获取相关数据,因而在处理任何种类的视频纹理信息时,都能具有相对稳定并且可靠的合成性能。
通过采用不同的测试序列来验证我们的系统设计,并与传统的视频编码标准进行对比。实验结果表明,本文的实现在保证了一定的主观质量下,能够一定程度地降低码流大小。在主观质量稳定的情况下,平均码率下降可达11.38%。