基于卷积神经网络的人体行为识别研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jbue520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,高清视频设备的推出使得基于行为识别技术的人工智能在智慧安全城市、智能家居和军事安防等领域得以飞速发展。广泛的应用前景和经济价值让行为分析与识别这一技术迅速成为计算机视觉领域的研究热点。传统的行为识别算法通常分为运动前景检测、特征提取以及训练识别三个步骤。虽然该方法的识别率尚可接受,但是其鲁棒性不高,且工作量巨大。此外,实际场景中目标之间多有遮挡、背景复杂多样以及拍摄角度不固定等因素都造成传统方法识别困难甚至失效。本文旨在利用卷积神经网络(Convolutional Neural Networks,CNN)改善传统行为识别方法中存在的这些问题,在提高算法鲁棒性的同时尽量提高识别的准确率。针对背景减差法和帧间差分法在运动幅度不太大的情况下无法提取完整前景的缺点,本文提出基于高斯差分(Difference of Gaussian,DoG)图像的人体剪影提取算法。该方法利用两张相邻高斯尺度空间的图像相减构造包含人体轮廓信息的差分图像,然后对其进行二值强化、形态学处理等操作得到粗略的人体剪影图像;第二步使用阈值对每行的粗略人体剪影区域进行扫描检测,再经闭运算等操作后得到完整准确的人体剪影图像。为融合图像序列的时域信息,本文累加周期内的人体剪影图像,生成二维特征图,并将其送入到CNN中进行训练识别。最终,经过网络调参和五折交叉验证等实验后在KTH公共数据集上得到85.3%的平均准确率,证明该识别框架具有一定的可行性。为了更好地处理视频数据,学者们将卷积神经网络扩展到了三维。本文利用3D CNN进行实验,发现特征组合"光流图-帧差图-三帧帧差图"可以取得最佳识别效果。经过网络调参和五折交叉验证等实验后在KTH公共数据集上得到92.0%的平均准确率。其次,通过分析KTH数据集中各类样本数量的比例分布及其对应的准确率,本论文提出使用二次训练、过取样策略和扩展数据集这三种改进方法来证明数据分布不均衡对实验结果确有影响,并以此提高识别率。最终,三种改进方法分别达到93.5%、92.8%和94.7%的平均准确率,为小样本或不均衡数据集的分类问题提供解决办法。此外,利用3DCNN进行行为识别的方法在减少特征提取工作量的同时提高了算法的鲁棒性,即改善了传统识别方法中存在的问题。
其他文献
为探讨延庆县生态清洁型小流域治理效果,以西沟里小流域为例,进行为期4年(2010-2013年)沟道断面的水质指标监测,对比分析小流域综合治理期间水质的CODMn、BOD5、TP、TN、DO含量
半挂车作为交通运输业发展过程中较为重要的组成部分,其运输安全问题一直倍受社会各界的关注。文章重点对半挂车车架开裂问题类型及产生原因进行了分析,同时提出了相应的优化
为对比研究不同水文模型在滦河流域的模拟精度,分别选取垂向混合产流模型和VIC模型,以滦河滦县水文站以上流域为研究流域,基于滦县水文站1980—1989年水文资料,对比分析不同
在绝大多数的边坡失稳案例中,环境水都以不同形式、不同程度地参与其中,多以降雨入渗为主,也有新建水库蓄水引起的,还有水库快速泄洪引起的。环境水的作用主要体现在降低岩土体的
<正>随着农业现代化的快速发展,干燥技术装备在粮食和农副产品加工等领域的应用备受重视。尤其在粮食干燥领域,随着技术装备研发的不断深入,粮食干燥技术装备种类迅速增加,企
本文根据抽样调查的结果,从工作-家庭冲突和家庭-工作冲突两个维度探讨了中国转型时期青年白领的工作家庭冲突问题及影响因素。分析发现,青年白领的工作家庭冲突程度总的来说
【正】 1986年10—12月,为了配合洛阳市房屋开发公司兴隆新村的基本建设,我们在洛阳市南昌路发掘了一批汉墓,现摘其BM3,简报于后: 该墓为一横列前堂双后室的砖室墓(图一),墓
本文首先介绍了海南省旅游市场的基本情况,详细研究了海南旅游市场发展的特点,并总结出境外旅游市场持续低迷及旅游娱乐项目较少等制约海南旅游发展的因素。针对上述问题,结