论文部分内容阅读
随着计算机多媒体技术的快速发展,人们对数字图像与视频有了更高的要求。传统的数字高清2D电视虽然在图像质量上较以前来说有了很大的提高,但是它显示的是二维信息,不能体现真实的三维世界,满足不了人们在观看视频时对真实感的追求。人们希望在观看视频时有一种真真切切的身临其境的感受,于是三维立体显示便应运而生。3D显示器只能播放特定的3D内容,用立体相机直接产生3D视频的方法简单方便,但是代价较高。目前已经有大量传统2D视频,寻找一种合适算法将2D视频转化为可以在立体显示器上播放的3D视频更有现实的意义。近年来,研究者通过引入不同的算法来解决2D转3D这个问题,并取得了一定的效果。目前“二维视频+深度信息”的立体视频格式在2D转3D方案中经常使用,因此如何获得2D视频序列的深度信息是2D转3D中最重要的工作。本文采用的是基于人机交互的深度信息估计方案,首先将二维视频序列分解成一帧帧图像,并依据内容人工确定为关键帧和非关键帧,然后对关键帧图像进行前景和背景分割,结合摄像机小孔成像原理,依据各个物体构图关系、颜色、形状等特征信息估计关键帧深度信息。非关键帧深度信息采用运动估计的算法由计算机自动生成。本文还对运动估计算法做了进一步的改进,将搜索模式采用的大菱形模板修改为六边形模板。改进后的算法在保证综合性能前提下,能够降低平均搜索点数,提高非关键帧深度信息生成效率。以往通过人工赋值生成的深度图只着重表现图像中前景和背景的整体效果,在立体显示设备上播放时虽然有一定的立体感,但是容易产生“纸片”效果。本文提出了基于模型匹配的精确深度信息生成算法,对需要重点突出的前景物体通过建模软件构造一个线框模型,通过全局变化和局部变化将线框模型与前景物体匹配,然后通过曲面建模建立数学模型,借助三维特征精确生成深度信息。本算法能够生成精确的深度信息,立体效果明显、真实感强,而且不会产生“纸片”效果。