论文部分内容阅读
监控视觉内容理解是计算机视觉智能化的一个重要方面,也是计算机视觉在实际应用中亟待解决的问题。监控视觉内容理解既可以促进计算机视觉理论的不断完善和发展,又能产生巨大的社会价值和经济价值。
监控视觉的内容理解是多方面的,不同的应用目的有其不同的理解要求;不同理解角度,会得到相应的理解结果。
监控视觉内容理解的特点是可以预先获取视觉的场景知识、目标类别、目标运动等方面知识,并将这些知识运用到相应的内容理解之中。
本文提出的监控视觉内容理解的关键技术包括视觉关键帧、基于内容的视觉关键帧、运动目标快速分类、目标运动理解、以及场景的分析与理解。本文的主要研究工作及其创新点归纳如下:
1.本文提出了视觉关键帧。视觉关键帧能够节省视觉信息的存储量,减少视觉信息的查询量,并能通过插值算法基本上恢复原始视觉过程。本文提出了一种基于边缘信息特征和运动分析进行决策,自动选取视觉关键帧的方法。视觉关键帧自动遴选是在视觉图像的分析和理解基础上完成的。在监控视觉中,三维目标的运动引起二维图像的变化,得到时变二维图像系列;首先对其系列二维图像进行预处理,消除环境光变化产生的影响,提取图像边缘特征信息,便于分析和计算;然后进行差分分析和图像边缘特征信息量分析,确定三维空间中运动目标的运动参数和形变信息,达到对视觉信息的理解,从系列视觉图像中自动遴选出关键帧的目的。
2.本文界定了基于内容的视觉关键帧,即视觉关键帧为(1)当运动目标刚进入场景的前后两帧;(2)运动目标退出场景的前后两帧;(3)目标在场景中开始运动到运动结束的两帧;(4)运动目标发生遮挡或遮挡解除的视觉帧;(5)场景中3D目标2D投影轮廓的显著变化的前后两帧。本文提出了一种基于内容的视觉关键帧的遴选方法。该方法首先采用差分阈值法、边缘检测、“与”运算、投影法获取运动目标的大致轮廓,接着使用基于LevelSet的主动轮廓方法获取运动目标的较为精确轮廓;在分析了多种目标轮廓描述的经典方法及其相似性度量性能后,采用了小波变换的尺度系数描述运动目标的整体轮廓,用小波系数的广义高斯密度分布描述参数描述目标轮廓的细节,在整体和细节两个层面上理解目标轮廓的变化。
3.本文研究了视觉监控中运动目标的情况,针对视觉监控中的两类主要运动目标——人和车辆,提出了一种逐层细化的树形快速分类方法。该方法利用运动目标的视觉图像和运动信息获取运动目标的归整轮廓,用双目或者单目视觉测量
运动目标的特征数据,运用场景知识、目标知识和运动知识,先将运动目标分为人和车辆两类,然后分别针对人和车辆,采用不同特征进行分类。对于人体采用身高、颜色进行细化分类;对于车辆,提出了一种具有RST不变性的描述因子,根据车辆的外观尺寸和其描述因子,获取车辆的类型并分类,并采用颜色对车辆进行细化描述。对于颜色聚类描述效果不佳的情况,本文认为是运动目标的呈现纹理特征,因此,本文改进了传统的树形小波纹理描述的方法,提出了一种新的树形小波描述纹理的方法。这种树形小波纹理描述方法用小波分解后的低频子带描述纹理的能量特征,根据能量阈值对其高频子带进行多级分解,逼近纹理方向,获取纹理的能量特征和方向特征,并以此对运动目标进行分类。该分类方法避免了样本训练和模板匹配,分类速度快。
4.本文提出了一种基于知识的人体运动的理解方法。该方法通过分析视觉图像和应用相关知识推断场景中人体的运动情况。根据相邻两帧记录的人体运动信息,确定运动人体目标的位置;在改进的HSV空间,对运动目标进行区域颜色聚类,计算区域的聚类中心和聚类区域的重心;根据聚类区域重心的变化以及人体特征知识、人体运动知识及其相应的规则,从整体或细节上理解人体的运动。
5.本文通过对场景的颜色特征进行分析和研究,理解场景的照度和色调分布,获得场景变化的语义描述,并根据其语义描述或自动控制场景中的相关设备,或报告场景中的相关情况。场景分析与理解研究工作是基于灰度直方图的场景照度理解和基于色调的场景理解。首先根据场景的灰度直方图分析,理解场景中的整体照度情况和局部照度情况的方法,并说明了根据场景照度理解得到的结果,对场景进行控制的方法。然后通过划分场景,获取场景各个子区域的色调直方图,分析直方图,得到场景的色调布局;分析其色调直方图的变化,获取场景中目标的进入和退出、目标的运动、目标的色调等信息,估计目标尺寸和目标的运动。