论文部分内容阅读
HEVC是新一代视频压缩国际标准,相对比H.264/AVC标准,它可以在保证视频传输质量同等水平前提下,实现编码效率大幅提高,同时,HEVC为并行而生,在编解码超高清视频领域相比H.264/AVC更加灵活。然而,其带来了编解码效率提高的同时也带来了巨大的编、解码运算复杂度,成为推广应用的最大瓶颈。本文以多核处理器Tilera-GX36作为硬件平台,分别研究了HEVC解码算法的并行优化和多路视频流的并行解码技术。论文的主要工作和创新如下:1.研究并实现了解码过程中基于CTU单元的波前并行处理方法。基于CTU单元之间的依赖性分析,重新设计CTU依赖表和缓存交互策略,结合线程池技术,实现了基于CTU单元的波前并行算法。在图像质量保持同等可靠性的同时,极大提高了并行解码系统的并行解码效率,解决了超高清视频流帧图像局部计算复杂度过载情况。2.研究并实现了深度耦合DF和SAO的快速融合环路滤波算法。通过对HEVC解码框架中DF模块中对亮度分量去方块滤波、色度分量去方块滤波以及SAO样本自适应补偿三者之间数据依赖关系分析,重新设计解码方法流程,深度耦合DF去方块滤波和样本自适应补偿SAO,实现快速融合环路滤波。减少了核心与缓存之间的交互通信,提高了解码效率。3.研究并实现了基于集成化众核平台的多路视频流并行高速解码调度策略。针对Tilera-GX36众核平台,提出了并行的分像素插值解码算法,并且使用SSE2指令集优化实现了快速并行分像素插值优化;结合上述基于CTU颗粒度的HEVC波前并行解码算法以及快速融合环路滤波算法,在像素解码重构模块和快速环路滤波模块之间运用流水线并行技术,实现了多层次并行解码的融合;基于多核平台设计了动态多路并行调度算法,实现了二路高清视频的实时并行高速解码,提高了多核处理平台的核资源利用率以及解码执行效率。本文针对每一个算法,设计了与当下主流的算法对比实验。实验结果表明,基于CTU单元的波前并行算法比主流的OWF波前并行算法有了明显的提高,解码时间平均降低了9.9%;基于CTU单元的快速融合环路滤波算法比基于多核处理器的任务级与数据级相结合的HEVC并行解码技术与实现中的环路滤波算法有了解码帧率的显著提高,在QP为32,6核数情况下解码时间平均降低了2.3%;基于Tilera-GX36集成化众核平台的多路视频流并行高速解码调度算法可完成二路HEVC视频流自适应实时高效并行解码。最后,对于论文所做的全部工作做出了总结,同时,基于目前研究成果提出了对未来研究工作的期望。