论文部分内容阅读
人体行为识别是指通过各种传感器感知行为活动数据,并利用计算机自动检测技术分析和理解人体各种行为的过程,其在很多方面有着广泛的应用前景,包括视频监控、医疗诊断和监护、智能家具和智能人机交互等。在人体行为识别方面,当前的研究工作主要是使用传统的深度学习模型进行特征提取,存在关键特征提取不足、工作量大且难以保证时效性的问题。为此,高效准确的人体行为识别算法研究成为一个新的热点。本文旨在探索不同的行为识别算法,从中选取感知高效、识别实时且泛化能力强的算法进行人体行为识别。人体行为识别技术的核心主要包含感知和识别两方面,旨在将先进的模式识别技术、传感器技术以及计算机技术等有效地综合运用于整个人体行为识别系统。本文对深度学习算法进行了全面地分析和总结,探索不同的深度学习算法对时间序列数据进行特征提取时的性能,设计并实现了两种新颖的模型用于提取人体行为识别的细粒度特征,极大地提高了行为分类的准确率。此外,本文还全面地分析了传感器数据的特点,探索其在人体行为识别系统中的应用价值。本文的主要工作如下:(1)提出了一种新的人体行为识别网络HDL(Hierarchical Deep Learning,分层深度学习),它结合了 DBLSTM(深度双向长短时记忆网络)模型和CNN(卷积神经网络)模型。为了更好地捕捉时间序列数据的信息,本文加深BLSTM层的层数,前一个BLSTM层的输出被传送到下一个BLSTM层。随着BLSTM层数的增加,可以获得更加抽象的输出结果,从而提取到原始数据的细粒度特征。此外,将CNN引入到DBLSTM模型中进行特征提取,取得了显著的效果。在UCI HAR数据集上的实验结果表明,HDL网络的准确率和F1值分别高达97.95%和 97.27%,准确率比 S-LSTM 和 Dropout CNN 分别高 2.14%和 6.97%。(2)由于HDL进行特征提取只是按照顺序简单地过滤数据,没有对反应行为变化的关键特征进行捕捉。因此,设计了一种融合BLSTM与attention机制的人体行为识别模型ABLSTM。BLSTM通过正向LSTM和反向LSTM提取输入数据的粗粒度特征。attention用于分析粗粒度特征集的重要程度,获得更为突出的细粒度特征。在UCI HAR数据集上的实验结果表明,ABLSTM模型准确率和F1值为99.4和99.0%,准确率和F1值比HDL分别高达1.45%和1.73%。同时在Opportunity数据集进行验证,实验结果表明,ABLSTM能够很好地识别人类活动,F1值高达92.7%,推动了在移动感知方面人体行为识别的最新水平。(3)研究传感器数据的内在属性,采集的数据具有时间序列的特征表达。在真实的智能手机数据集上对模型进行实验验证,采用分布规律的时间序列数据作为人体行为识别模型的输入,利用时间序列数据的上下文信息来发现数据何时相关,而不是简单地处理单个数据帧。实验结果表明,HDL和ABLSTM两种模型均能够有效地提取出随时间变化的数据特征,弥补以往对于视频图像数据进行特征提取带来的精度损失问题,从而能够提高人体行为识别精度。