论文部分内容阅读
视频序列中的运动目标检测与跟踪研究利用计算机视觉和视频分析方法,对视频输入装置得到的图像序列进行自动分析,实现对运动目标的检测、定位和跟踪,为更高层的视频理解和场景解释提供底层对象和分析依据。它是计算机科学、图像工程、模式识别、人工智能等多学科的结晶。随着理论算法和硬件处理技术的快速发展,视频目标检测跟踪技术已经应用在武器导航、科学探测等工业领域以及小区监控、智能交通、自动驾驶、人机交互等民用领域,并将有着更为广泛的应用前景。目前,视频目标检测跟踪的研究在理论和应用上还面临着很多困难,如在检测中如何兼顾目标的完整性和边界的精确性,在跟踪中如何适应目标尺度变化、模板变化及速度、轨迹变化等。国内外很多学者对此进行了大量研究和探索,本文即是在这些研究的基础上,针对上述问题展开研究工作。主要工作可概括如下:在运动目标检测方面,针对检测的准确性和完整性要求,提出了一种基于马尔科夫随机场模型的时-空联合目标检测实现方法。在空域检测中,提出了Mean-Shift约束标记的分水岭分割方法。该方法利用了Mean-Shift算法的聚类特性,在序列帧的特征域和图像域寻找概率密度集中区,并结合两个域的信息标记出图像的视觉关注区,作为分水岭分割的约束条件,避免了分水岭算法容易产生的过分割现象。建立了简化S-TMRF模型,构建相应的后验能量函数,将空域检测和时域检测的信息统一在MRF-MAP检测框架下,得到了更为准确、完整,符合人的视觉感受的检测目标。在运动目标跟踪方面,针对传统Mean-Shift采用固定核窗宽,难以适应目标尺度变化,易造成定位不准甚至失踪的缺点。提出了基于边界力的核窗宽自适应调节方法。在对Mean-Shift算法中目标模型进行分析的基础上,引入了边界力的概念,在Mean-Shift跟踪中加入跟踪目标边界附近空间点的特征匹配约束,从而能够获得当前跟踪目标的位置和尺度,并根据检测估计到的尺度来调节核函数带宽。该算法与传统的三步法相比,减少了运算量和运算复杂度,可以更稳定的跟踪空间尺度变化较大的目标。研究了Mean-Shift跟踪中的状态判断问题,在分析目标和背景特征相对关系的基础上,引入特征增强函数,构造了新的背景模板。在跟踪过程中,通过对候选目标与两个模板相似度系数的综合分析,可以准确判断跟踪所处的状态及可能的产生原因,并采取相应的模板调整策略。由于综合考虑了目标与背景的相互影响,算法对跟踪状态的辨别更为准确。研究了粒子滤波在轨迹复杂的快速运动目标跟踪中的应用。针对粒子滤波算法需要大量粒子来近似描述目标状态,耗时较多的问题,利用Mean-Shift算法在重采样前将粒子收敛到靠近目标真实状态的区域内,使粒子的分布更为合理有效。算法减少了粒子滤波跟踪所需要的粒子数,提高了算法的跟踪效率。最后,在算法研究的基础上,针对室内监控这一特定背景环境,设计搭建了一个基于TI公司高性能DSP处理器TMS320DM642芯片的目标监控系统测试平台。根据硬件系统本身的性能和特点,在算法结构、代码结构和DM642芯片功能三个层次上进行了优化,以满足实时性的需要。在系统设计中,采用主-从端结构分流运算负荷,并充分利用DSP的运算性能和可编程性,使系统具有可重构性,能够适应多种图像处理的要求,具有一定的通用性