论文部分内容阅读
随着科技的发展进步和“智慧城市”、“平安城市”等公共安全项目的开展和推进,视频监控技术的应用越来越广泛。传统的视频监控存在很多问题,如人工监控低效、存储信息冗余、无法自动分析视频及异常预警等。在此背景下,智能化视频监控成为公共安全领域急需解决的关键问题。异常事件检测是智能视频监控的重要部分,其指的是利用图像处理和计算机视觉技术准确快速地检测出视频中的异常行为,方便工作人员尽快地进行处理。其对于智慧城市安全方面的建设具有重要意义,一直以来被学术界和工业界广泛关注。在实际城市视频监控场景中,借助于视频内容分析技术的快速发展,异常检测取得了很大的进展,但仍然存在一些问题和挑战,主要表现在:1)受光照、遮挡等影响,监控画面目标检测过程中容易出现漏检的情况,影响后续检测算法的性能;2)监控场景复杂多样,很多方法对视频的表示都不够充分和完善,以往大多数方法采用底层手工特征或单一特征,判别性差,造成后续异常检测效果不理想;3)目前方法大都只是检测异常,并未对事件判定为异常的原因进行解释。基于这些问题,本文以深度学习为工具,对监控场景下的异常行为检测方法进行研究,具体如下:1.提出了基于改进的融合目标外观和运动信息的异常检测方法。以往的方法大多数对图像或视频进行分块处理,容易导致目标的割裂,进而造成运动信息丢失,影响后续异常检测器的性能。本文采用以目标对象为中心的方法,使用基于深度目标检测的算法SSD提取视频中的目标,该算法可以准确地检测小尺寸目标,而且运行速度较快。考虑到传统方法采用的底层运动特征对运动信息表征不够,本文基于目标对象提取光流,并提出了一种新的高效的结合动能的多尺度光流直方图来捕获目标的局部运动统计信息。然后,本文提出基于双流自编码器的异常检测方法学习运动目标的外观信息和运动信息的深度特征,这样得到的隐空间表示对于正常样本和异常样本更具区分性。最后,本文提出一个基于跟踪的后处理模块跟踪异常区域,对异常目标进行再定位,来减少由于监控场景中遮挡、光照变化、景深等带来的目标漏检情况。相关实验表明本文提出的方法能够有效地检测和定位异常。2.提出了一种基于目标多元视觉概念分析的异常检测方法。在实际智能监控系统中,异常事件的检测和解释很重要,可以帮助工作人员快速识别和判断异常事件进而给出处理方案,节省人力、物力成本。本文围绕异常的可解释性展开研究,通过多个分支来学习目标的基本视觉概念:对象类别、行为类别、运动状态,并整合到异常检测的框架中。这些分支通过联合学习到视频目标的外观和运动状态的语义信息,共同检测和解释异常。其中,本文提出的改进的行为识别模块结合了目标跟踪来利用帧间信息,用于解决监控视频场景中的行为识别问题。运动状态分支采用基于一对多分类的方法进行分析,能够很好地区分正常和异常的运动模式。最后,通过各个分支的联合分析和融合结果进行异常判别。实验结果表明该方法可以有效地检测出异常,并可通过多元分析学习到的多个视觉概念来对异常进行描述。