论文部分内容阅读
随着现代社会节奏的加快以及生活智能化的普及,以视频捕获为主要目的的监控系统越来越被智能识别系统所取代,以此来减少之前对捕获的视频进行人工识别时人力、物力和时间的浪费。以人体动作、姿态为对象的识别在安防、家居、老人监护等社会生活的各个方面都呈现出了广泛的需求。由于人体动作具有复杂的非刚性运动特性以及动作在不同人之间甚至在同一人之间呈现普遍的差异性,这些对人体动作识别算法的鲁棒性提出了更高的要求。由于人体动作序列相比人脸、车等静态目标具有长时空相关性,将整个动作序列表示成高维空间的数据点进行分类会造成动作数据中的时间信息的损失。于是,以图模型为基础的人体动作识别通过建立样本序列帧之间的权重关系,来捕获人体姿态前后变化的规律从而进行识别的方法得到了广泛的关注。本文以图模型中的条件随机场和含隐变量的条件随机场作为模型基础,以人体动作序列为对象,针对在模型创建过程中常常出现的人为强制约束与过度自由两方面的缺陷,开展了大量的研究工作。本文的主要研究内容如下:1.通过分析人体动作序列帧之间的关系与特点,建立高阶非邻域边关系的图模型来弥补链式条件随机场损失的非邻域信息。引入L1-group正则项对图模型进行稀疏,从而寻求得到人体动作的本征图模型结构。2.针对人体动作序列帧具有的离散性特点,在隐条件随机场的基础上提出阶段隐条件随机场(Stage-HCRF)。Stage-HCRF通过解析来自上一层隐藏节点的信息,将动作信息按阶段表征为下一层隐藏节点的状态。引入L1-group正则项对Stage-HCRF模型的两隐藏层进行稀疏,消除模型建立时的过度自由并得到人体动作在Stage-HCRF下更好的本征结构。