论文部分内容阅读
随着计算机技术的发展,原本很多无法实现的应用都由于新技术的出现而得到解决,特别是在一些计算机视觉问题上。而由于受到人类双目成像的启发,如何高效精确地将双目摄像机图像还原成带有深度的3D信息越来越受到人们的关注。本文主要讨论和研究了如何利用置信度传播理论去解决双目视觉问题。在回顾近几十年双目视觉发展技术以后,为了成套的解决双目视觉的问题,首先使用双目摄像机的标定算法获得标定信息,再利用标定信息校正定位它;然后使用灰度相关法去获取较粗超的深度信息,并将该深度信息映射到代价空间中。置信度传播理论的原理涉及到概率和图论的几大领域,从贝叶斯网络开始发展的马尔科夫随机场是整个置信度传播理论的基石和优化模型,而吉布斯能量场则为置信度传播理论奠定了理论基础,在带环的马尔科夫随机场模型的情况下,实现了通用置信度传播算法。由于置信度传播算法的高度并行性,使用显卡加速并行计算加速整个算法就显得非常可行。介绍CUDA计算的原理和可行性之后,本文讲述了如何使用CUDA实现一般置信度传播理论的流程和方法。本文将立体匹配的置信度传播算法从空间上推广到时间上,提出基于时序的图片序列的置信度传播优化算法,将原本多次迭代才能够收敛的算法改进成只需一次或两次迭代就能达到收敛的效果。程序实现了通用置信度传播算法和CUDA加速算法,通过对比两算法的实验结果,得出GPU并行计算对置信度传播理论加速有效性和实用性的结论。然后对比我们提出的基于时序图片序列的置信度算法的收敛次数和实验效果,从实验上论证了算法的可行性。最后本文建设性的使用多线程优化技术,通过比较流水线方法和算法内部并行处理方法,将置信度传播算法的速度又提高了3~ 4倍,最终达到每帧20ms左右的速度。