论文部分内容阅读
MPEG-4视频编码标准是近期研究的一个热点.它是一种视频内容可交互的新的编码标准,提供了一些如形状编码、运动估计和补偿、纹理编码、Sprite编码及可分级编码等工具,应用于数字电视、流媒体、移动多媒体等领域.MPEG-4开发的是极低比特率的图像编码技术,编码后数据速率可以低于64Kbps,将重点放在图像具体目标的交互性和可操作性上.VOP和Sprite是MPEG-4中的两个重要概念,是实现极低比特率传输的重要方法.该文研究带深度信息Sprite的生成,并对MPEG-4编码方法进行初步研究.Sprite是由视频对象所有可能出现在场景中的区域组成,这些区域在整个视频段中都可能出现,但并不全部象素都出现在每一帧.该文就Sprite生成中两个重要步骤,运动估计和参数几何模型的建模进行了详细的论述.生成Sprite的方法是,用搜索范围自适应的运动估计得到运动块的对应关系,再用梯度下降法计算透视模型的八个参数,得到物体运动参数.论文详细描述了用透视模型的全局运动估计生成Sprite的算法,同时,就二维Sprite的编码特点,讨论了MPEG-4的部分编码方法.论文下一步工作是提取图像的前景对象和背景Sprite的三维信息.在摄像机参数和拍摄参数都已知的情况下,根据图像特征点之间的视差关系来获取三维信息.论文中详细描述了其理论原理.图像序列特征点的选择和匹配,是在边缘点中选择相关系数符合条件的点,利用三个图像之间的极线关系直接进行匹配.论文给出详细的步骤和实验结果.最后对三维Sprite的编码特性进行了初步探讨.该文所进行的研究希望可以在两个方面带来促进作用:第一,传输MPEG-4视频流的时候,可以同时得到摄像机的运动信息,对视频流进行三维重构,而传统的Sprite编码是只针对二维视频的,该研究希望会带来更广阔的应用前景;第二,在二维视频序列中较为快速提取真实的三维信息,并使用Sprite技术试图实现最低码率下传统三维信息,可以减少三维信息的数据量,对网络上传输三维信息大有好处.