论文部分内容阅读
随着人们对3D电视、3D电影的日益关注,3D产业正以惊人的速度快速的发展着。现如今,3D视频片源短缺是制约3D产业发展的一个重要因素。3D视频是由两个带有视差的视频组成,通常被称为左眼视频和右眼视频,这两个视频通过立体显示技术显示到屏幕上,保证观众的左右眼同步观看到左右眼视频,观看者就能自动感觉到场景的深度层次感,从而形成一个立体的感觉。3D视频片源制作有多种方法,主要有三类:双摄像机直接采集左右眼视频;采用彩色相机采集彩色视频外加深度相机采集深度视频;采用单摄像机采集彩色视频,然后通过视频处理算法估计出相应的深度视频,这种方法也称为2D-3D视频转换方法。在众多3D片源制作方法中,2D-3D转换的方法只需要一个普通的相机,就能制作出高质量的3D片源,同时该方法还能将大量的现有2D资源转换成3D形式,这是其他方法无法比拟的优势。因此,2D-3D转换的方法是当前最廉价,也是最实用的3D片源制作方法。按照人工参与的程度,现有实用的2D-3D转换系统分为自动和半自动系统。针对半自动系统中关键帧选择和深度传播算法中存在的问题,本文提出了两种改进的方法。首先,提出了一种基于累积遮挡区域的关键帧选择算法,该算法结合时域帧间隔和视频帧之间的运动关系,采用累积遮挡区域来度量深度传播出现的误差,根据生成的累积遮挡区域曲线,在误差大的地方选择关键帧。实验结果表明,跟以前的按照固定帧间隔选择关键帧的方案相比,本文的算法能使整个视频所有帧的深度图保持一个较低的误差水平,进而改善3D视频的整体效果。然后,本文受到着色理论中的颜色一致性的启发,提出了一种基于深度一致性的深度传播算法。深度一致性指的是相邻的两个像素,如果其颜色类似的话,那么它们的深度值也应该是相近的。根据这一原理,将深度传播建模成一个有约束的优化问题。仿真实验中,与当前性能最好的深度传播算法——位移双边滤波算法(SBF)相比,本文的算法不仅能取得和SBF算法类似的深度图质量,同时还能降低算法的复杂度,将算法速度提高5倍左右。此外,本文针对算法在半自动图像2D-3D中的应用,开发了一个交互式的软件平台,在该平台下,用户对输入图片只需简单地进行涂鸦、设定深度值等少量操作,就能得到高质量的深度图和3D视图,该软件简单、方便、实用。针对自动系统,本文在计算机平台下实现两种2D-3D转换软件,分别是针对单个图像和视频的转换。单张图像的2D-3D转换软件提供两种深度估计算法,针对输入的单张图像自动实现深度图估计和3D视图合成功能。在视频2D-3D转换软件中,算法结合颜色和运动深度线索,自动的对输入的彩色视频进行深度估计,然后根据深度视频进行立体合成,得到左右眼视频。这两个软件都能达到现有电视产品中2D-3D转换的水平,能广泛应用在3D电视、3D芯片等领域。