论文部分内容阅读
对于工作在非结构化环境中的移动机器人,能够具有良好的场景感知与理解能力是其实现自主导航并自主探索环境的前提条件。由于非结构化环境具有多样性、复杂性、随机性等特点,同时机器人可获得的视觉导航先验信息不稳定,且对非结构化环境中多类物体的辨识技术仍不成熟,因此如何使机器人更好地感知并理解非结构化环境成为近年来机器视觉领域密切关注的具有挑战性的研究热点,本文从以下方面对这一问题展开进一步研究。首先,对非结构化环境中的路标信息从不同于地面水平视角的航拍角度进行识别,使移动机器人获得从地面视角难以获得的稳定路标信息,从而更有效地完成视觉导航。其次,为提高室外非结构化环境中多类物体的识别正确率,辅助机器人更加智能化地工作,在求得最佳图像分割块数后,对室外场景中多类物体的识别方法展开进一步研究。本文以HSP电动攀爬车为平台,建立室外场景图像理解原型系统。根据机器人在非结构化环境中实现基于视觉的导航与环境探索的特点和要求,对基于阴影的航拍图像建筑物检测算法、结合深度信息和图模型求得最佳图像分割块数的算法以及基于条件随机场的多类物体识别算法展开研究。论文的主要研究工作如下:第一,对场景理解在机器人视觉中的研究及应用进行回顾,对本文涉及三项关键技术的国内外研究现状进行详细分析。针对目前基于机器视觉的室外场景理解在导航和多类物体辨识上的不足,提出航拍图像建筑物检测和地面场景物体识别的研究方案。第二,针对基于阴影的航拍图像建筑物检测在建筑物位置搜索及边界提取的不足,提出在简化的建筑物-阴影模型下检测航拍图像中任意轮廓建筑物的算法。该算法在提取建筑物的阴影后,结合航拍图像的拍摄地点及拍摄时间,参照建筑物-阴影模型,能够快速搜索到建筑物方位及建筑物和阴影边界,省去边界的直线逼近过程并加快边界的提取速度。当确定建筑物的初步位置后,通过对比种子和周围区域的灰度直方图得到最终建筑物区域。因此该算法能够更为快速准确地检测出航拍图像中的建筑物。第三,针对目前研究中图像分割块数和区域合并阈值是根据经验值人为设定,提出通过深度信息和图模型相结合的三维聚类图模型,来确定最优图像分割块数和区域合并闽值。构造以图像分割块数和区域合并阈值为自变量的三维聚类图模型正确率评估函数,通过分析该函数的极值,得到最优图像分割块数和区域合并阈值的组合。在此基础上,利用三维深度信息对二维平面图模型进行编辑,得到整个场景的三维聚类图模型。第四,为了识别环境中多类物体,对基于分类器的物体辨识展开研究。分析并提取每类物体有效的图像特征,将不同特征进行融合,通过可变长的样本选择方法来选择训练数据,对不同类型的物体设计对应的分类器,以实现对室外场景图像中主要物体的初步识别。第五,针对基于中低层特征构造的分类器对物体识别时忽略了物体间的相关性,提出基于多分类器初步识别基础上的条件随机场模型。引入针对每类分类器置信度评分的比例系数,构造条件随机场模型的单节点项函数。在使用初步检测特征的基础上加入三维深度特征,利用相邻超级像素间特征的相关性构造条件随机场模型的相邻节点项函数。最后,通过置信传播实现对室外场景物体的最终识别。最后,论文以HSP电动攀爬车为平台,设计室外场景理解原型系统,该系统由航拍图像建筑物检测模块和地面场景物体识别模块组成。航拍图像建筑物检测模块通过识别航拍图像中的建筑物,获得全局导航的先验信息;地面场景物体识别模块在对采集到的图像提取深度信息后,得到该场景的三维聚类图模型,最后通过基于多分类器初步识别基础上的条件随机场模型实现场景中物体的最终辨识,以实现局部环境感知。