论文部分内容阅读
针对近些年来模式识别在计算机视觉领域的相关研究,越来越多的学者、互联网公司愿意花高成本高代价投入到智能人体行为识别技术中来,可见对视频中人体行为进行智能识别已经显现出极高的学术价值和商业价值。现阶段的人体行为识别更多的还只停留在对简单背景下人体的简单肢体动作,比如走、跑、跳、弯腰、拍手等行为进行识别,当视频场景中干扰因素太多,或者对识别的准确率和实时性有较高要求时,就目前提出的相关算法,往往不是太过单一,就是运算速度太慢,或者识别率太低。行为识别的步骤大致分为行为特征提取,特征训练和特征分类识别三步。本文在参考了大量国际论文和先进算法后,针对上述特征描述的有关问题,在特征提取阶段,提出了一种全新的特征描述子--PE-Cuboid用来表征人体行为,将目前应用较广泛的全局特征像素变化概率图(PCRM)、边缘方向直方图(EOH)和局部特征立方体(Cuboid)描述子相结合,有效克服了在提取单一特征时所提取的特征不能完整表征人体行为的缺点;在训练分类器阶段,本文还对比了多种机器学习方法,分别使用传统的码本(Codebook)和词袋模型(bag-of-words),字典学习和稀疏编码分别训练得到行为特征描述,最后使用支持向量机(SVM)对行为特征描述序列打分识别,得分最高的即为识别结果。另外不同于传统特征融合单纯的叠加或平铺特征,本文在融合混合特征时算法也有改进。本文算法通过Matlab进行仿真,对目前公开的KTH、Weizmann标准行为数据库和本文自建测试行为视频中均做了测试,并针对算法中涉及到的有关参数设置以及与当前一些其他先进算法的对比比较都做了深入的分析讲解,实验结果显示,本文算法能有效提高识别率。