论文部分内容阅读
随着计算机科学技术的发展,利用图像信息的视频分析系统越来越多的被应用到各种领域,目前在基于视频的监控及分析的诸多研究领域中,所涉及到的最重要运动目标是人体,如智能视频监控系统中实时的监测并识别人的可疑行为、在高级接口领域中理解人的手势及其他行为、在运动视频中对运动员的动作进行分析等。因此,对运动人体进行建模、识别是一项基础性的理论研究工作,涉及到计算机视觉、模式识别、人工智能等多个研究领域,具有极大的挑战性。 本文在概率图模型的指导下,针对人体在运动过程中存在的多尺度特征信息和运动序列的上下文信息,提出了一种多尺度条件随机场模型对人体动作进行建模和识别。首先利用常规的目标检测方法,经过背景提取、目标检测、阴影消除、形态学处理、连通性分析和大小归一化等图像预处理操作,得到视频序列中运动人体目标;然后考虑人体的运动轨迹,体态特征以及肢体运动情况,运用多尺度特征提取的方法从大、中、小三个尺度上提取人体运动特征,充分利用了运动过程中的多尺度特征信息提高了运动分析的精度。最后对比目前常用的两种概率图模型—隐马尔可夫模型和条件随机场模型,提出了多尺度条件随机场模型,该模型可以充分利用动作序列的上下文信息以及不同尺度状态之间的相互限制和影响信息。通过实验对比表明,多尺度条件随机场模型在兼顾了人体运动的各方面信息后,解决了人在同一时刻进行多种动作的问题,并且识别效果较好。