论文部分内容阅读
智能视频监控技术是计算机视觉领域近年来新兴的一个研究方向。它的主要研究目标是利用计算机视觉技术、图像视频处理技术和人工智能技术对监控视频的内容进行描述、理解和分析,并能根据分析的结果对视频监控系统进行控制,从而使视频监控系统具有较高层次的智能化水平。它的主要研究内容包括:监控视频运动对象的提取、对象的描述、对象的跟踪、对象的识别和对象的行为分析等。智能视频监控技术可以被用于公共安全监控、医疗看护、交通管理、顾客服务等众多的领域,具有深刻的理论价值和广泛的应用前景。本文致力于智能视频监控技术的关键问题的研究,主要完成以下几方面的创新性工作:在视频运动对象的描述方面,针对目前描述视频对象的形状特征不完善、不直观的情况,提出了两种新的形状特征:基于定向距离矢量的轮廓描述符和小波轮廓描述符。特别是后一种特征对形状的描述非常直观,与人的感觉很相似;对图像的旋转、平移、缩放皆具有不变性,对对象的形变也有着很好的抗干扰能力;数据结构很清晰,可以支持在不同分辨率下的检索;对于非凸形状也有很好描述能力;特征提取速度快,能够满足实时处理的需要。该特征的提出为后续的对象跟踪、对象识别和对象行为分析方法的实现打下坚实的基础。在对象跟踪方面,首先提出了一种基于线性预测和轮廓匹配的多对象跟踪方法。该方法跟踪效果好,无论跟踪的对象是刚体还是非刚体都可以实现准确跟踪,而且跟踪到的轮廓曲线和跟踪对象的真实轮廓非常吻合,这样的轮廓曲线可以用于进一步的对象的识别和行为分析;跟踪过程稳定,即使对象的运动速度发生较大变化仍可以稳定地进行跟踪;计算复杂度小,跟踪速度快,可以实现实时跟踪。在这之后,本文又提出了一种基于均值漂移和轮廓匹配的多对象跟踪方法,该方法是对上一种方法的改进,主要是将上一种方法中单纯的线性预测方法改进为均值漂移和线性预测相结合的方法,从而进一步提高了跟踪的稳定性和可靠性。在对象识别方面,首先提出了一种基于均值漂移和区域生长的图像分割方法,接着提出了一种基于Jacket矩阵的图像压缩方法,最后提出了一种基于小波轮廓描述符和支持向量机的对象识别方法。前两种方法属于对象识别中的图像预处理,有助于更好地构造对象识别所需的训练样本。后一种方法是对象识别的主体,它可以根据形状的不同来对视频运动对象进行准确分类。该方法中用来描述对象形状的特征就是前面提到的小波轮廓描述符,基于该特征本文重新构造一套支持向量机的训练方案和分类方案,从而实现了对视频运动对象的实时高效识别。该方法不但可以对视频中出现的人、动物、车辆等进行准确区分,还可以区分人的站立、卧倒、坐下等不同的姿态,这一点也为后面的对象行为分析提供了有力的工具。在对象行为分析方面,提出一种基于三层模型的行为分析方法。该方法可以用来分析单个对象发生的行为,如:跑、跳、卧倒、匍匐前进等,也可以分析多个对象共同发生的行为,如:物体的留置、人群的聚集等。各个行为的分析是相互独立的,可以单个进行也可以多个同时进行。分析速度快,可以满足实时视频监控的要求。最后为了改进和验证方法,构建了完整的图像检索原型系统和人物行为分析原型系统。