监控视觉内容理解的关键技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qqq1254
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
监控视觉内容理解是计算机视觉智能化的一个重要方面,也是计算机视觉在实际应用中亟待解决的问题。监控视觉内容理解既可以促进计算机视觉理论的不断完善和发展,又能产生巨大的社会价值和经济价值。   监控视觉的内容理解是多方面的,不同的应用目的有其不同的理解要求;不同理解角度,会得到相应的理解结果。   监控视觉内容理解的特点是可以预先获取视觉的场景知识、目标类别、目标运动等方面知识,并将这些知识运用到相应的内容理解之中。   本文提出的监控视觉内容理解的关键技术包括视觉关键帧、基于内容的视觉关键帧、运动目标快速分类、目标运动理解、以及场景的分析与理解。本文的主要研究工作及其创新点归纳如下:   1.本文提出了视觉关键帧。视觉关键帧能够节省视觉信息的存储量,减少视觉信息的查询量,并能通过插值算法基本上恢复原始视觉过程。本文提出了一种基于边缘信息特征和运动分析进行决策,自动选取视觉关键帧的方法。视觉关键帧自动遴选是在视觉图像的分析和理解基础上完成的。在监控视觉中,三维目标的运动引起二维图像的变化,得到时变二维图像系列;首先对其系列二维图像进行预处理,消除环境光变化产生的影响,提取图像边缘特征信息,便于分析和计算;然后进行差分分析和图像边缘特征信息量分析,确定三维空间中运动目标的运动参数和形变信息,达到对视觉信息的理解,从系列视觉图像中自动遴选出关键帧的目的。   2.本文界定了基于内容的视觉关键帧,即视觉关键帧为(1)当运动目标刚进入场景的前后两帧;(2)运动目标退出场景的前后两帧;(3)目标在场景中开始运动到运动结束的两帧;(4)运动目标发生遮挡或遮挡解除的视觉帧;(5)场景中3D目标2D投影轮廓的显著变化的前后两帧。本文提出了一种基于内容的视觉关键帧的遴选方法。该方法首先采用差分阈值法、边缘检测、“与”运算、投影法获取运动目标的大致轮廓,接着使用基于LevelSet的主动轮廓方法获取运动目标的较为精确轮廓;在分析了多种目标轮廓描述的经典方法及其相似性度量性能后,采用了小波变换的尺度系数描述运动目标的整体轮廓,用小波系数的广义高斯密度分布描述参数描述目标轮廓的细节,在整体和细节两个层面上理解目标轮廓的变化。   3.本文研究了视觉监控中运动目标的情况,针对视觉监控中的两类主要运动目标——人和车辆,提出了一种逐层细化的树形快速分类方法。该方法利用运动目标的视觉图像和运动信息获取运动目标的归整轮廓,用双目或者单目视觉测量   运动目标的特征数据,运用场景知识、目标知识和运动知识,先将运动目标分为人和车辆两类,然后分别针对人和车辆,采用不同特征进行分类。对于人体采用身高、颜色进行细化分类;对于车辆,提出了一种具有RST不变性的描述因子,根据车辆的外观尺寸和其描述因子,获取车辆的类型并分类,并采用颜色对车辆进行细化描述。对于颜色聚类描述效果不佳的情况,本文认为是运动目标的呈现纹理特征,因此,本文改进了传统的树形小波纹理描述的方法,提出了一种新的树形小波描述纹理的方法。这种树形小波纹理描述方法用小波分解后的低频子带描述纹理的能量特征,根据能量阈值对其高频子带进行多级分解,逼近纹理方向,获取纹理的能量特征和方向特征,并以此对运动目标进行分类。该分类方法避免了样本训练和模板匹配,分类速度快。   4.本文提出了一种基于知识的人体运动的理解方法。该方法通过分析视觉图像和应用相关知识推断场景中人体的运动情况。根据相邻两帧记录的人体运动信息,确定运动人体目标的位置;在改进的HSV空间,对运动目标进行区域颜色聚类,计算区域的聚类中心和聚类区域的重心;根据聚类区域重心的变化以及人体特征知识、人体运动知识及其相应的规则,从整体或细节上理解人体的运动。   5.本文通过对场景的颜色特征进行分析和研究,理解场景的照度和色调分布,获得场景变化的语义描述,并根据其语义描述或自动控制场景中的相关设备,或报告场景中的相关情况。场景分析与理解研究工作是基于灰度直方图的场景照度理解和基于色调的场景理解。首先根据场景的灰度直方图分析,理解场景中的整体照度情况和局部照度情况的方法,并说明了根据场景照度理解得到的结果,对场景进行控制的方法。然后通过划分场景,获取场景各个子区域的色调直方图,分析直方图,得到场景的色调布局;分析其色调直方图的变化,获取场景中目标的进入和退出、目标的运动、目标的色调等信息,估计目标尺寸和目标的运动。
其他文献
传统计算模式中的服务选择方法只是根据功能对服务进行选择,并没有考虑服务的上下文关系以及影响功能的其它因素,使服务的选择具有盲目性,导致系统性能的下降.该文对普适计算
本文的主要工作是在讨论模式识别理论方法的基础上,对其在一些多维信号领域的应用进行了分析和测试。本文在总结当前一些应用算法的基础上,根据每个领域自身的特点,设计了一
本文结合科研项目背景中的实际需求,分别针对以上三个步骤中XML的具体应用展开了研究。本文的研究结果可主要归纳为以下几个方面:  1.异构XML数据上完整性约束的挖掘  该部
近年来,随着计算机性能的不断提高,图像处理和计算机视觉得到了越来越多的应用。它们处理的对象是静止的图像或者运动的图像序列。由于图像信息量大、所包含内容的特殊性和复杂
目前,有不同的研究建议未来互联网建立为以内容为中心的网络(命名数据网络,或NDN),以替代现有的基于端对端通信的TCP/IP架构。针对这些新型的网络架构,其安全与隐私问题较少受到关
本文研究对等计算系统中基于XML的查询路由和数据路由的问题,作者提出了在非结构化对等计算系统中的XML查询路由索引技术,以及结构化对等计算系统中XML数据包的分发技术,旨在改
程序分割是将程序的部分程序代码从本地迁移到其他计算节点。传统的程序分割技术主要应用于并行与分布式计算领域。近几年,随着移动设备的发展,用户需求不断增长,移动设备资源有
本文结合宝钢炼钢厂办公管理系统的项目背景,针对上述问题对工作流技术和应用集成技术展开研究,在此基础上提出了可行的解决方案。文章提出了应用数据、过程定义数据、组织结构
随着Internet的发展,各种实时业务应运而生,这对服务质量(Quality of Service,QoS)提出了更高要求。传统的QoS 路由算法在实现路由技术上暴露出缺陷,主要体现在路由信息不能及时
文字识别是模式识别的一个重要分支,其任务是研究如何使计算机能够"识字".它涉及模式识别、图象处理、数字信号处理、模糊数学等学科,是一门综合性技术,在中文信息处理、办公