视频编码率失真模型及优化技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:huangyqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高度信息化的年代,视频作为最重要的信息承载媒介之一,日益深入地影响着人类的生产和生活方式。视频数据量的爆炸式增长,对现有信息传输和存储的效能不断地提出更高的要求,视频编码技术自然就成为国内外研究和工业应用的关注热点。至今国际上已经制订诸如MPEG-1/2/4,H.261,H.263,H.264和AVS等一系列的国际视频编码标准,这些标准对于将视频应用推向市场起到了至关重要的作用,例如人们所熟知的VCD,DVD,广播电视,IPTV和蓝光光盘等,它们的兴起和普及正是归功于国际视频编码标准的巨大成功。   从国际视频编码标准的发展历程来看,主流的技术趋势仍然没有脱离传统的混合编码框架。对于每一种压缩工具,压缩效率的提升不仅来自原理上不断深入的探索和优化,同时还引入更加丰富的编码模式来适应视频动态波动的统计特性。为了实现整体快速、高效的编码,视频编码器不仅需要针对每种压缩工具定义合理的编码模式,更重要地,还必须设计高效的编码控制算法来协调各个工具的应用。   码率和失真是衡量编码性能最重要的两个参数,为了达到两者的最佳折衷,实现率失真意义下最优的编码控制,编码器通常采用率失真优化技术来进行模式决策。率失真优化作为一种编码控制算法,与混合编码框架中的多项压缩工具均有不同程度的耦合,那么如何结合每种压缩工具的率失真行为,设计相应的率失真优化技术方案,最大程度地发挥率失真优化的作用,并将其应用于第三代脏VC标准之中,具有十分重要的理论和应用价值。综上所述,本文以率失真优化和HEVC标准为研究背景,从视频混合编码框架中的几个关键模块入手,结合率失真优化技术展开研究。本文的研究目标是深入地理解视频信号与编码工具之间的率失真关系,建立更加精细的率失真模型,提出高效快速的率失真优化编码技术方案。在此基础之上,本文还将联合率失真优化和几项关键的压缩工具,深入地探索第三代视频编码算法,并从实验分析和数学推导相结合的角度进行论证。本文的创新点包括以下四个方面:   1、频域加权的率失真模型   在实际的应用场合中,为了实现对编码器输出率失真的准确控制,比如码率控制和模式决策,首先需要建立假设的率失真模型,然后根据率失真模型预测编码器的行为。率失真模型代表着视频统计特性和编码器行为之间的数学关系,通常还包含一些动态更新的模型参数。率失真模型的准确性和复杂度直接影响着编码器控制的精度和效率。对于码率模型,代表性的工作包括利用量化参数,预测残差l1范数或者系数块中零元素比例等来对码率进行预测。然而在一些实验观察中发现,当码率估计的单位精细到块级时,已有的码率模型仍然存在较大的预测误差,原因在于它们没有区分不同频率分量对码率的不同贡献度。为了解决这个问题,本文借助一般化高斯模型,通过理论推导和近似得出量化系数块的自信息表达式,并在此基础之上提出频域加权的码率模型,通过对比实验验证了它的有效性。对于失真模型,本文在已有工作的基础之上,深入地分析了视频编码中的失真来源,模拟了系数的量化过程,并在此基础之上提出了进一步简化的频域失真估计方法。   2、低复杂度的率失真优化编码   在第二代H.264/AVC和AVS视频编码中,编码器采用率失真优化技术来选择每个图像块的最优编码模式。尽管率失真优化技术非常有效,它同时也带来了很大的计算负担,这主要因为第二代编码标准引入了多种编码模式,并且率失真代价本身的计算复杂度很高。为了降低率失真优化的复杂度,本文提出采用低复杂度的率失真估计方法来替代原有的准确码率失真计算。采用本文提出的优化编码方法,可以在编码效率基本不降低的前提下,节省率失真代价计算过程中的反量化、反变换、熵编码和像素重建步骤,实现低复杂度的率失真优化编码,加快整体的编码运行速度。   3、率失真最优的变换方法   主流的国际视频编码标准通常对预测残差采用行列可分离的二维离散余弦变换,通过二维离散余弦变换,残差块的能量被聚集在少数的几个低频系数上,从而后续的系数扫描和熵编码方法可以非常高效地对量化系数进行组织和编码。虽然在理论和实践上都已经被证明,在带约束的一阶马尔科夫条件下,离散余弦变换的变换效率接近最优的K-L变换,固定的一组变换矩阵仍然不能够很有效地适应自然视频图像动态波动的统计特性。针对这个问题,本文提出率失真最优变换方法,该方法与传统离散余弦变换方法最大的不同之处在于,对于每个残差块,提出方法设计有多个待选的变换矩阵。在编码过程中,编码器通过率失真优化选择率失真代价最小的一组行、列变换,并将其应用于最终的变换,同时将变换矩阵的索引信息进行编码和传输。为了获得一组率失真性能最优的待选变换矩阵,本文设计了一种两步迭代的训练方法,用于离线地训练出一组局部最优的变换矩阵集合,并且证明了迭代过程的收敛性。同时本文还提出了率失真最优变换方法的快速编码算法,用于降低编码端的计算复杂度。   4、HEVC技术的分析和改进   第三代HEVC标准的制定工作是近两年来该领域内最受关注的热点之一,与以往的标准相比,HEVC标准在技术框架上有一定程度上的突破,同时也引入了很多新的研究问题。本文以HEVC标准为背景,通过实验分析和理论推导,得出已有技术的理论支持和改进方案,研究内容涵盖了帧内:DST-Ⅶ,模式相关扫描和色度四叉树变换结构,并通过实验验证了改进算法的有效性。   综上所述,本文结合实验观察和理论分析,不仅在核心编码工具的率失真行为方面给出了更加深入的诠释和创新的设计方案,同时对整体的编码器控制提出了高效的优化方案,为深入理解视频编码中的率失真问题提供了进一步的理论指导和实践证明。
其他文献
无线感知反应网络已成为计算机领域的最受关注的前沿课题之一。本文以无线感知反应网络在依托,提出一种智能楼宇系统的解决方案。   为了实现智能楼宇系统所应有的功能和性
计算机数控技术是装备制造业的重要支撑技术。高档数控系统在可靠性、精度、速度、安全性等方面提出了更高的要求。任务同步是影响操作系统性能和实时性的重要方面。非阻塞同
随着当今世界逐渐从信息化转型为数据化,模式识别和数据挖掘等领域面临越来越大的挑战。爆炸式增长的数据量使得特征选择过程成为大数据模式识别等领域必不可少的环节。特征也
城市生活产生了很多轨迹数据,这些数据能够帮助认识身边的城市,了解人们的活动模式,为居民和政府提供准确的参考信息。群体行为涉及社会活动,交通规划,军事监督等领域,在很多的应用
随着网络信息的迅猛增长,人们希望海量文本能被标记上合适的词标签,即用一个或几个词对文本内容进行描述,这样可以极大地加快人们的浏览速度。而且,好的标签对于提高文本分类
学位
随着移动通信技术的飞速发展,移动设备逐渐成为人们获取信息的主要平台之一。然而,由于移动多媒体技术和移动信息承载、传输能力的提升,尤其是移动社交网络的兴起,大量丰富多
Due to the growth of internet media entertainment, video streaming has gained popularity in todays media streaming.An increased demand of both live and on deman
超声检测技术主要用于航空航天、高精密加工等领域的无损检测。其核心部分之一是缺陷识别,即采集到反射回波后,如何识别出是不是有缺陷,是何种缺陷等。特征的提取和特征向量的建
学位