论文部分内容阅读
随着信息技术的飞速发展,人们已不满足于单摄像机拍摄的传统视频,而是需要具有更加灵活性和更好交互性的多视角视频。多视角视频由位于不同视角的多个摄像机同时拍摄得到,播放时这些不同视角拍摄的图像均会被传送到用户终端,用户可以根据喜好选择不同的视角进行观看。由于多视角视频会产生大量数据,而运动估计和视差估计作为提高数据压缩效率的有效方法成为需要解决的关键问题之一。
本文针对多视角视频的特点,研究如何利用有效的运动估计算法使其使用于视差估计,并结合运动补偿时域滤波和视差补偿视角滤波等技术对全局视差估计方法进行编码分析。
首先,对传统的基于块匹配的运动估计算法和相位相关全局运动估计算法进行分析。针对多视角视频中相机的拍摄位置以及全局视差场的特点,采用改进搜索范围和多参考峰值等方法,通过仿真试验验证改进现有运动和视差估计方法对多视角视频的适用性。
其次,基于对传统方法的改进,本文提出了全局透视视差估计方法。文中采用了仿射和透视两种视差模式进行比较。使用相位相关方法代替传统的三步搜索方法用作初始估计,确保梯度下降的收敛性。使用低通外插方法用于边界填充。在全局视差估计的基础上,针对前景物体的运动和视差特点,通过对全局补偿差图的分析,使用局部视差重估计方法以提高视差估计的准确性。通过试验比较和分析了采用仿射和透视两种模式的全局视差估计方法以及传统的相位相关全局方法。
然后,在运动补偿时域滤波和视差补偿视角滤波基础上构建了基于小波提升机制的多视角视频编码框架,对本文所提出的全局视差估计方法的编码结果进行了分析和比较。
最后,总结了本文的研究工作,并展望了未来的工作方向。