论文部分内容阅读
近景目标的三维重建是数字摄影测量与计算机视觉领域中一项复杂的综合性技术,可用于国民生产各行各业。本文选取了基于结构光的三维重建技术、基于轮廓线的三维重建技术、几何模型与多视影像配准三个典型问题中的若干关键技术进行了深入研究,具体研究内容和研究结果如下:(1)单帧投影下的结构光扫描关键技术。本文完成了伪随机投影图案的设计和特性分析,邻域窗口沿核线方向的全局唯一性分析,提出了一种SEEM快速影像匹配方法,包括核线影像种子点匹配和基于区域增长的密集匹配,进行了错点剔除和匹配算法并行优化等。通过实验数据提出了两个长度为n的随机序列的相关系数服从均值为0、标准差为1/(?)n的正态分布的假设,在此假设下,使用11×11的窗口进行种子点匹配可以在整条核线上保证匹配点的唯一性,使用5×5的窗口进行区域增长匹配可以在小范围内保证匹配点的唯一性。一旦出现了错误的匹配,根据伪随机投影图案的性质,区域增长算法将迅速达到边界,这是从匹配点中剔除错点的关键。在扫描距离约为600mm,基线长度约为276mm时,点云的绝对精度为0.185mm,相对精度为3200分之一,像方精度约为0.3像素。在CPU Core2T5850、内存2GB的配置下,算法达到了每秒约40万点的匹配速度。(2)轮廓线约束下的多视影像三维重建。本文完成了基于图割的物体轮廓线半自动提取,轮廓线的平滑,轮廓线图像的四叉树森林压缩存储,体素模型和表面网格模型的生成算法,表面网格模型的优化。不同的赋权方式会得到不同的图割结果,但没有哪一种赋权方式具有明显的优势。为了尽可能地减少人工交互的工作量,在拍摄影像时应尽量选择与物体的亮度、颜色相差较大的背景。由于在生成体素模型和表面网格模型时,需要将所有的轮廓线图像同时读入内存中(每张影像约10MB),采用四叉树森林存储轮廓线图像这种近似二值图像,可以达到100到300倍的压缩率,而访问四叉树的叶子节点需要从根节点开始逐层向下搜索,最好情况是1层,最坏的情况是9层。对于圆形过渡的曲面,拍摄影像的角度的任意性对其重建的主观效果影响不大,适当增加影像的数量就可以得到更精细的结果;对于较大的平面,很容易形成三角形的凸起,只有当某一张影像的摄影中心刚好位于或者接近该平面时,才可以消除这种现象,拍摄时需针对性地选择视角;对于存在凹陷的部分,本章节的方法从理论和实践上都无法得到好的重建结果;本章节中用于实验的物体表面都缺乏(或者局部缺乏)纹理,无法使用影像匹配的方法得到更好的重建结果,是在不使用结构光扫描(或其他相似的技术手段)前提下,本章节的方法是最合适的。(3)几何模型与多视影像配准。本文完成了几何模型与多视影像的粗配准(空间相似变换),基于互信息的精配准,包括OpenGL渲染图的生成方法,渲染图上几何特征显著区域的选择,灰度联合直方图的统计,基于Powell方法的配准参数优化等。在粗配准中,需要首先根据物体和背景的相对关系将影像分成不同的组,每一个影像组位于同一个坐标系中。影像组坐标系与几何模型坐标系之间、不同的影像组坐标系系之间存在不同的配准传递策略,在人工选取同名点时,可以根据实际情况选择不同的策略,最终将所有的影像组坐标系都配准到几何模型坐标系中。在精配准中,OpenGL光照方向的不同、直方图统计区域的选择都会影响最终的配准结果,光照方向与真实影像的光照条件越接近,配准精度越高,只统计几何特征的影响大于纹理特征影响的区域,将得到更好的配准结果。对与具有镜面反射特性的物体,由于影像的灰度依赖于物体的几何曲率变化,故经过基于互信息的优化后,配准参数的精度得到提高。在一个影像组仅有1张影像的特殊情况下,舍去缩放系数,仅对6个参数进行优化,仍可以得到较好的配准结果。基于空间相似变换的粗配准需要少量的人工交互,每一个影像组需要至少3对同名点,每组耗时在5分钟之内;而基于互信息的精配准的耗时也在可接受的范围之内。