基于Tilera多核处理器的HEVC多路视频流并行解码方法的设计与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:sdfsdffsgf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HEVC是新一代视频压缩国际标准,相对比H.264/AVC标准,它可以在保证视频传输质量同等水平前提下,实现编码效率大幅提高,同时,HEVC为并行而生,在编解码超高清视频领域相比H.264/AVC更加灵活。然而,其带来了编解码效率提高的同时也带来了巨大的编、解码运算复杂度,成为推广应用的最大瓶颈。本文以多核处理器Tilera-GX36作为硬件平台,分别研究了HEVC解码算法的并行优化和多路视频流的并行解码技术。论文的主要工作和创新如下:1.研究并实现了解码过程中基于CTU单元的波前并行处理方法。基于CTU单元之间的依赖性分析,重新设计CTU依赖表和缓存交互策略,结合线程池技术,实现了基于CTU单元的波前并行算法。在图像质量保持同等可靠性的同时,极大提高了并行解码系统的并行解码效率,解决了超高清视频流帧图像局部计算复杂度过载情况。2.研究并实现了深度耦合DF和SAO的快速融合环路滤波算法。通过对HEVC解码框架中DF模块中对亮度分量去方块滤波、色度分量去方块滤波以及SAO样本自适应补偿三者之间数据依赖关系分析,重新设计解码方法流程,深度耦合DF去方块滤波和样本自适应补偿SAO,实现快速融合环路滤波。减少了核心与缓存之间的交互通信,提高了解码效率。3.研究并实现了基于集成化众核平台的多路视频流并行高速解码调度策略。针对Tilera-GX36众核平台,提出了并行的分像素插值解码算法,并且使用SSE2指令集优化实现了快速并行分像素插值优化;结合上述基于CTU颗粒度的HEVC波前并行解码算法以及快速融合环路滤波算法,在像素解码重构模块和快速环路滤波模块之间运用流水线并行技术,实现了多层次并行解码的融合;基于多核平台设计了动态多路并行调度算法,实现了二路高清视频的实时并行高速解码,提高了多核处理平台的核资源利用率以及解码执行效率。本文针对每一个算法,设计了与当下主流的算法对比实验。实验结果表明,基于CTU单元的波前并行算法比主流的OWF波前并行算法有了明显的提高,解码时间平均降低了9.9%;基于CTU单元的快速融合环路滤波算法比基于多核处理器的任务级与数据级相结合的HEVC并行解码技术与实现中的环路滤波算法有了解码帧率的显著提高,在QP为32,6核数情况下解码时间平均降低了2.3%;基于Tilera-GX36集成化众核平台的多路视频流并行高速解码调度算法可完成二路HEVC视频流自适应实时高效并行解码。最后,对于论文所做的全部工作做出了总结,同时,基于目前研究成果提出了对未来研究工作的期望。
其他文献
色彩是绘画的基本要素,在历史的漫长发展中,中国画艺术出现多种绘画形式。其中,“撞色”法就是中国画表现技法之一。从近几年全国性美术展览中的中国画作品来看,运用“撞色”法的画家越来越多。有的作品把“撞色”法当做主要技法,也有把这种技法用于对背景的表现或者个别物件的点缀,以此来达到画家所追求的效果。“撞色”法的出现是历经许多人创作实践得来,它源于张僧繇的“凹凸花”,发育于尉迟乙僧的“凹凸法”,开始于徐熙
目的:观察左心室肥厚兔左心室内外膜心肌细胞中缓慢型延迟整流钾电流(IKs)通道KCNQ1和KCNE1 mRNA表达水平的差异,探讨IKs通道在兔肥厚心肌复极离散度增大中的作用。方法:55只雄性
研究了影响水解聚丙烯酰胺(HPAM)-间苯二酚-六亚甲基四胺冻胶调剖剂体系成胶时间和冻胶强度的各种因素。实验结果表明,未反应的体系可泵性良好,体系的pH值影响成胶时间和冻胶强
画家使用新的工具,材料或某些特殊技术来达到传统绘画技法无法表现的特殊效果,这种效果会给画家本人一种成就感,也会带给观者一种新奇感。这就是特殊技法的魅力,是对传统技法的创新,但这并不是评判一件艺术品的标准,绘画作品应该要具有特别的艺术特质,既传客观之神,又抒主观之情。水拓技法所产生的肌理与其他技法所产生的肌理不同。画家可以打破传统的作画规矩,根据自己的意图作画,能够使作者的情感更好的与画面融合,达到
结合国内外市场概况,介绍了对乙酰氨基苯酚各种生产工艺及国内外技术进展,提出了国内生产存在的问题及发展方向.