基于神经网络的VP9编码块划分快速算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:a18102023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
VP9与H.265/HEVC同属最新一代视频编码标准,且两者编码性能相近。由于格式开源且无使用授权费,VP9在高清与超高清视频编码应用领域受到了越来越多的支持与推广。与上一代视频编码标准VP8相比,一系列新技术的引入使其编码性能提升了近一倍,即在降低近50%码率的前提下保持相同的视频质量。然而,编码性能得到改善的同时也伴随着编码复杂度的大幅提升,严重限制了其在一些实时编码场景下的应用。为此,本文针对编码器中复杂度占比最高的超级块划分模式选择进行优化处理,并针对不同应用场景的不同限制要求实现了复杂度的自适应控制。针对CU模式划分复杂度过高的问题,本文首先剖析了影响四叉树递归划分过程的主要因素,并基于块划分与不划分特征差异性对划分模式进行快速预测。与传统分类算法不同,本文采用离线训练所得BP神经网络模型作为分类器。其输入为能够表征块空时域特性的36个SAD值,输出为相应块划分模式,且网络训练时充分考虑了误判决对编码性能的影响。为了简化模型结构并提升分类器性能,本文提出将复杂的四叉树递归划分过程建模成一个三层二分类模型,即针对不同的QP和块大小分别获取不同的网络模型。最后,通过结合所有分类器输出结果,可得简化版的四叉树结构。所提算法仅需对简化后的四叉树进行遍历,从而避免了大部分不必要的块遍历,大大的提升编码效率。为了进一步实现复杂度的自适应控制,本文首先获取分类器输出模式置信度信息,并分析输出模式置信度与预判决准确率之间的关系。考虑到两者之间存在高度一致性,本文提出设置一个阈值参数对概率较大的决策模式直接采用,而对过于模糊的模式输出进行RDO处理。并通过改变不同层分类器的各个阈值参数的取值,实现超级块划分模式候选集的自适应缩减。为了实现目标复杂度的精细匹配,本文按复杂度控制强弱建立了一个阈值参数候选集,并动态为每一帧设置一组不同的阈值参数,以将帧级复杂度控制在一定的范围区间。实验结果表明,该算法能够非常精准的将编码复杂度控制在一个较大的范围区间。其中,上限对应原始编码性能,此时没有复杂度优化;下限对应复杂度的最大程度优化,此时编码性能损失也最为严重。且在总编码复杂度降低40%的前提下,编码性能小幅度下降。
其他文献
Gα亚基基因是G蛋白信号调节途径的中心结构,也是激活G蛋白信号传导的关键亚基,在不同组织细胞中能转导不同的信号,完成不同的生物学功能。为全面了解Gα亚基基因在色素沉积
基于"互联网+"的学习模式是一种新的、有效的学习方式,给予学习者充分的学习自由,高职院校开展线上培训是人才培养的积极探索。但通过调查发现,高职院校线上培训课程还存在不少
旨在探讨SOX5在小鼠皮肤毛色中的作用。本研究随机选取出生后12d的C57BL/6品系黑色、棕色、灰色小鼠各3只,采用实时荧光定量PCR、Western blotting和免疫组织化学方法对SOX5
无序、失控的假日旅游客流对旅游业永续发展构成了深度危害。本文初步探讨了旅游环境容量调控系统的构成、功能及其调控途径与手段。
我国矿产开发的历史悠久,可以追溯到石器对代的晚期,而矿业政策的制定,则出现于春秋战国时期。此后历代都制定和发布了不少矿业玫策。在青铜器时代,即夏、商、周时期,所有的
事业单位公开招聘对进一步深化事业单位人事制度改革,健全事业单位人事管理,促进事业单位发展具有重要意义,但是也应该看到这一制度在实施过程中还有许多地方不够完善,有的新
<正>在全媒体的市场化环境中,电视媒体需要适应的规律和可选择的发展路径越来越多,不得不面临的不确定性也越来越多。为此,推进自己主导的协同创新是电视媒体的明智选择。电
本文认为,促使黄宗羲民主启蒙思想形成的原因有如下几个方面:明清之际开始出现的资本主义经济关系,政治斗争的新形势,自然科学的新成就以及王阳明心学的内在启发等都是影响黄宗羲
婴儿脑积水是小儿神经外科的常见疾病之一.目前脑室腹腔分流术仍然是婴儿脑积水的标准治疗方法.我们需要不断的总结分流手术的细节,逐渐将整个过程标准化,尽量减少并发症的发