论文部分内容阅读
前向运动的视频拍摄作为一种移动式的场景获取方式,由于其视野宽阔,空间覆盖面广,已经被广泛应用于移动式的场景监控和目标检测任务中。然而,随着视频资源的数据量不断增加,许多算法由于计算复杂性逐渐无法满足检测任务的实时性要求,而且庞大的视频数据量也为数据的存储和检索造成了困难。本文的研究基于摄像机前向运动拍摄的视频数据,从理论和应用两个方面展开论文的工作。首先提出了基于检测区域几何结构的全景环带采样方法,并构建快速的前向运动视频的全景拼接算法,将海量的视频数据进行无损的信息抽取,得到了轻量级的全景图格式,不仅降低了视频数据的存储和访问开销,而且将视频转化为一种更适合于人工检视或计算机分析处理的形式。之后,以铁路轨道状态和护栏缺损检测为应用研究背景,提出了相应的基于全景图的自动化视觉检测算法。本论文的创新工作如下:1.提出了一种基于检测区域几何结构的全景采样模型。不同于以往的视频拼接模型和图像对齐方法,本文提出的基于检测区域几何结构的全景采样方法可以快速简洁地从前向运动视频中生成全景图。在相机的内部参数已标定的情况下,仅仅依靠摄像机的运动信息和空间场景的几何结构先验,完成了拼接区域的构造和对齐,没有执行耗时的图像匹配和复杂的光流计算,实现了铁路环境视频的实时拼接,从而确保了基于全景图的后续视觉检测的实时性。2.提出了一种基于“双缝投影”的单目立体全景成像方法。首先构建了立体全景采样的“双缝投影”模型从每一帧图像中抽取一对具有不同视角的拼接条带,用来生成两幅具有显著视差的全景图;然后分析了立体全景图成像的原理来推导全景图深度的计算公式;最后利用全景图拼接方法生成了立体全景图像对,并基于局部立体匹配算法来估算“像位差”,从而获得空间场景的深度信息。立体全景图具有更广阔的视野和更强的真实感,场景的深度信息也为人工目视检测或计算机自动识别提供了更加丰富的决策信息。3.提出了一种基于轨道全景图(Rail track panorama)的钢轨健康状态的自动感知方法。在物理空间中,由于轨道不良状态而引起的列车晃动,势必引起图像空间中轨道全景图(RTP)的钢轨形态的变化。首先通过分析列车晃动下的几何成像模型,推导出“轨道不良状态—列车晃动—钢轨图像失真”之间的联系。之后利用图像阈值分割和形态学滤波的方法从轨道全景图上提取钢轨轮廓图像,并分析钢轨轮廓图像的失真变化来反演出轨道的健康状态。4.提出了一种基于护栏全景图(Fence panorama)的护栏缺损的自动化检测方法。一旦获得整个连续护栏的全景图,那么就可以首先利用阈值分割的方法自动提取护栏中竖直栏杆的位置,使其与背景图像分离:其次根据分析相邻栏杆之间的距离进行护栏缺损判别。本文提出了一种“基于MVG三维直方图的最大熵阈值分割方法”实现了栏杆位置的定位,并基于行程编码的思想将护栏全景图进行编码,压缩的编码格式包含了护栏的全部位置信息,大幅降低了存储开销,是一种有效的表示方法和存储格式。同时也设计了相应的解码算法从编码中恢复护栏的位置并实现了护栏的缺失检测。