论文部分内容阅读
在公共场所中,监控摄像头出现得越来越多。而仅仅依靠执法部门来对视频监控中的异常行为进行监测,会带来大量的资源浪费,而且效率低下。因此,如果计算机在接受监控设备传输过来的视频后,能够进行在线异常行为检测,这无疑会给执法部门带来很大的帮助。而要实现对于视频监控中的异常行为在线检测需要克服下面三个难点:算法能够满足实时性要求;算法能够有效利用长时序未裁剪视频数据集;算法能够应对监控摄像头所处环境的复杂性。面对这三个难点,本文提出了相应的方法来解决:1)本文提出了一种移动三维卷积网络,并结合有效卷积网络的结构,设计了移动有效卷积网络来进行视频行为识别,以此来实现算法的实时性。该网络能够实现同时对视频中长时与短时动作的识别,处理8帧视频输入时,在行为识别数据集UCF101上的正确率能达到92.1%,并且网络每秒处理视频数达到了31.3。2)本文将上述移动有效卷积网络代替未裁剪网络中的特征提取部分,并结合注意力权重机制,设计了移动未裁剪网络,来有效利用长时序未裁剪视频数据集。本文还提出了一种类激活序列相邻分数比较法,结合该改进的网络在不提取光流信息的前提下,在THUMOS 2014数据集上的正确率达到了81.9%。另外,针对时序行为检测问题,该网络在交并比阈值设为0.3的前提下,在THUMOS 2014数据集上平均均值精度达到了28.3。3)本文设计了两种数据增强方式来加强上述移动未裁剪网络的鲁棒性,以解决监控摄像头拍摄环境复杂的问题。通过此方法使得移动未裁剪网络在UCF-Crime数据集上正确率达到了46.3%。另外,本文利用了一种在线视频理解算法,实现了对视频中异常行为的在线检测。