基于Tilera多核处理器的HEVC视频编码并行算法的研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:superzf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HEVC是面向高清和超高清视频编码的新一代国际标准,具有更高的压缩性能。然而,极高的计算复杂度成为其应用主要障碍。随着多核处理器的发展,在多核平台下的并行编码成为解决问题的一种有效途径。本文基于TILE-Gx36多核处理平台对HEVC视频编码并行处理技术进行了研究,在深入挖掘HEVC中存在的并行潜力基础上,充分利用多核处理机制,提出了三种有效的并行编码算法。论文的主要研究内容和创新点如下:(1)提出了一种基于WPP思想的CTB行级并行编码算法。针对HEVC标准中的WPP并行算法效率低下的问题,通过研究帧内CTB与帧间CTB之间依赖关系,提出了以CTB行为并行粒度的帧内|帧间CTB行的并行处理算法,基于保持帧间相关性前提,一旦某CTB行编码线程结束,且当前帧没有剩余的需要编码的CTB行时,立即下一帧CTB行的编码,提高了并行加速比。(2)提出了一种改进的并行帧内预测算法。针对HEVC帧内预测过程的全遍历算法计算复杂度高,从而影响了编码速度的问题,在深入分析不同深度下CU的相关性后,通过构造优先级队列实现不同深度下的CU并行预测,同时在4×4粒度下通过共用参考像素,一次并行处理两个4×4大小的CU,使帧内预测的速度有了明显的改善。(3)提出了一种HEVC多粒度融合并行编码算法。基于上述研究得到的分析结果,进一步设计了多核分配与多线程调度策略,保证多核资源的充分利用;同时通过引入信号量与互斥量进行多核分配过程中的同步与通信,实现不同粒度的处理单元协调工作。在CTU层面利用CTB行级并行算法实现不同帧不同CTB行的并行编码,在CU层面利用并行帧内预测算法实现不同深度下CU并行编码,达到了整体视频编码性能的有效提升。论文对高清视频和超高清视频进行了实验和分析。其中,CTB行级并行算法在保证PSNR和码率的前提下,并行加速比最高达到了6.2;并行帧内预测算法最高可以节省%74的帧内预测时间,显著地提高了预测编码速度;多粒度融合的HEVC并行编码突破了CTB行级并行算法的性能瓶颈,最大并行加速比达到了6.3。实验结果表明,本文提出的并行算法在不影响视频图像质量的前提下,减少了计算复杂度,加快了编码速度,显著地提升了并行加速比。论文最后对全文工作进行了总结,并对后续研究方向进行了展望。
其他文献
过套管电阻率测井是目前最新的一种开发测井方法。该方法通过测量套管上三个电极间的微小电压降来计算地层的漏电流,进而计算出地层的视电阻率。过套管电阻率测井仪器的研制对
无线射频识别(RFID)是一种用于无线数据捕捉,处理和传输的技术。其自动识别机制主要依靠远程数据的存储和获取来实现,通过使用RFID 标签来完成。   RFID作为一种用于泛在网络
在能源消耗日益增长濒临枯竭,环境污染日渐严重的今天,开发可再生能源己成为全社会可持续发展的紧迫课题。作为可再生绿色能源的风能成为世界各国普遍重视的能源,风力发电技术也
节点布置是无线传感器网络(Wireless Sensor Network, WSN)的一个基本问题,是对监测区域的有效覆盖,也是网络初始化的第一个环节。节点布置的好坏关系到网络的资源配置,直接
多人交互行为分析已逐渐成为模式识别研究领域内的一个新的关注点。现有的识别方法大多数假设场景中只存在一种群体行为,而真实的场景中包含多种群体行为,为此本文提出了一种
激光通信在军事领域中的应用非常广泛。激光通信跟其他通信手段相比,具有电磁兼容性好、抗电磁干扰能力强、保密性强等特点。激光通信还非常适应战场移动指挥的通信需要,比如
视频的显著性描述已成为当前计算机视觉领域的研究热点,本文在视觉显著性的基础上,总结和拓展了两个基于视频显著性描述的视频处理技术——适合于监控视频的关键帧提取以及视
随着计算机产业的不断发展和变革,嵌入式系统的研发已经成为热门的研究领域,并且成功的应用到了社会的各个行业,如制造业,服务业,国防,互联网等。然而,嵌入式系统在走向网络
无线传感器网络中,为有效的延长网络生存周期,均衡网络能量消耗,需要研究合理高效的路由协议算法。同平面路由相比,分簇路由算法被认为具有良好的发展前景,但当前多数分簇路