基于深度学习的“微动作”识别技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jfhz2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学技术的日益成熟,如何让计算机理解多媒体中的信息已经成为计算机视觉领域的研究重点,其中图像识别已经取得了惊人的成果,但视频理解仍然面临着诸多挑战。“微动作”识别是指识别视频中人体的细微动作,这些动作无法进行伪装,可以直接反映人隐藏的真实心理状态。“微动作”的分析可应用于测谎、政治心理学分析等领域。不管在面试社交还是刑事审讯的场景中,对“微动作”的识别和分析都发挥着不可或缺的作用。传统的“微动作”识别主要依靠心理学家进行分析,本文中“微动作”识别以动作识别为基础。动作识别涉及时域维度的识别,类似于自然语言处理中使用的方法,需要进行语义及词语关联性的综合学习,动作识别也极其依赖于动作图像和时域信息的学习。将动作识别落地需要算法具有很强的实时性和较高的准确率。本文使用TSN中的采样方法,对视频进行解码和采样。针对视频背景杂乱,影响识别结果的问题,本文采用计算速度快的YOLO-V3目标检测网络预测采样帧中的人体框。对于动作识别网络计算速度和准确率之间的均衡,本文提出了一种2D卷积与3D卷积融合的动作识别网络模型。模型使用2D卷积提取RGB图像序列的空间特征图后,连接少量3D卷积,进行特征序列空间信息与时间信息的融合。本研究表明,该模型在保证识别准确率的条件下,加快了网络的计算速度,在NTU RGB+D 120“微动作”数据集上测试达到94.8%的准确率,对比TSN网络,准确率提升了 6.6%,对比I3D网络,算法时延约为I3D网络的1/3,证明本文模型算法的时效性相对更优。为了直观展示“微动作”识别模型的识别效果,本文设计并实现了一个“微动作”识别演示系统,对微动作识别进行了 Web页面的可视化展示。演示系统可以对上传的离线视频文件数据进行解码分析,使用本文提出的“微动作”识别算法,识别九种“微动作”视频,并将结果返回至前端页面,进行视频关键帧、识别时间及动作类别的显示。
其他文献
地下钱庄的出现严重影响了国家外汇储备的稳定和国际收支平衡,促进了洗钱、贪腐、贩毒等违法行为的产生。在大数据时代下,获取到的地下钱庄数据量呈现爆炸式增长,依靠传统人工手段进行分析侦破变得困难,与犯罪分子的较量已经逐步转变为现代化科学技术的比拼。针对于传统社区发现算法在该应用背景下的不足,本文提出了基于社区领导者和转移概率的标签传播算法(CTLPA),新算法的主要改进及创新有:(1)针对于传统LPA算
目前,电催化分解水体系中无论是阴极的析氢反应(HER),还是阳极的析氧反应(OER)性能最突出的催化剂仍为贵金属催化剂,如铂、钌和铱及其它们的化合物等,但高昂的价格和稀缺的存量限制了它们的大规模应用。近几年,大量的研究集中在非贵过渡金属,并取得了很大的进展,但催化活性相较贵金属还有较大的差距。有效调控催化剂化学组成及结构对于进一步提高电催化剂的性能十分重要。本论文基于铁系含硼化合物的设计制备、结构
“农超对接”在我国农产品流通中具有十分重要的作用。“农超对接”顺应现代农业发展趋势,推动现代农业与零售业高效对接,实现了农产品供应链转型和升级,在一定程度上帮助农
未成年人倾斜保护是一项重要的国家伦理,保护未成年人免受性侵害是其中一项重要内容。自上世纪中叶建立性犯罪信息登记制度以来,美国至今已建立了覆盖全国的性犯罪信息登记与公示制度作为事前预防性犯罪的有力措施。司法维度上,美国联邦最高法院已在众多案例中对该制度的合宪性进行了充分讨论,如是否构成对性犯罪者权利的不合理限制,是否违反“事后立法禁止”、“双重危险禁止”、“正当程序”等宪法原则。我国若欲通过性犯罪信
随着我国经济发展进入新常态,既要保持经济稳定增长,还要优化经济结构,向中高端水平迈进。在此形势下,“科教兴国”、“人才强国”等发展战略定位逐渐凸显,我国持续加大对R&D经费的投入,加快提升创新能力。但伴随房价快速上涨,资金“脱实向虚”可能一定程度上会挤占创新研发投入,进而影响城市创新能力的提升。同时,房地产的过度繁荣发展带来了如市场资金相对匮乏、城市居民生活成本、企业运营成本增加等诸多城市
目的:描述和分析贵州省高校大学生网络欺凌的流行现状和影响因素,为制定出相应的干预政策和防治措施提供依据。方法:采用多阶段分层整群随机抽样方法在贵州抽取3个地区6所高校55个班级共2669名学生,应用受网络欺凌行为问卷和自编网络欺凌影响因素调查表进行调查;采用Cronbach’α系数、折半信度系数和因子分析法进行问卷的信效度分析;影响因素的单因素分析采用χ2检验和Z检验,多因素分析采用传统单水平Lo
随着工业的发展,被控系统变得越来越复杂。在实际工程操作过程中,各种不确定性例如时滞、磁滞、死区等无处不在,它们的存在将会增加控制器设计的难度,影响系统的性能,甚至会导致振荡的产生,使系统不稳定无法正常运转,造成不必要的损失。因此对于实际工程的安全保障而言,学术界很有必要深入研究不确定非线性系统。此外,现在的一些工程项目常常对控制性能有一定的要求,因此需要设计控制算法,在保证被控系统稳定性的基础上提
Sirtuins是NAD+依赖的组蛋白去乙酰化酶,在调控新陈代谢和细胞内稳态方面有重要作用。SirT7是这个家族中唯一一个核仁定位的蛋白,能够与RNA PolⅠ结合,在rDNA的转录上起着至
为了便于协同设计、虚拟建筑和施工过程管理,建筑信息模型(Building Information Model,BIM)正在成为土木工程领域的重要工具。BIM技术的飞速发展,给建筑业带来的变革有目共睹。然而建筑业常用的BIM体系3D建模软件缺少岩土材料的材质属性,使其很难与常用岩土工程计算软件(如FLAC3D、ANSYS等)对接,不利于岩土工程领域BIM技术的发展。本文在深入理解BIM理念的基础上,
华北地区作为我国开采历史较长的煤田,经过长时间回采地质条件较好的部分已逐步回采完毕,转向地质条件更加复杂的深部和边缘地区寻找煤炭资源。随之而来的溃砂溃水、底板岩溶水害的威胁日益突出。目前对奥灰大型突水事故,如陷落柱、断层等常规通道已经有了较为有利的治理手段,大型突水事故逐渐减少,而事故的发生正在逐步转向隐蔽。济宁矿区是华北型煤田非典型大水矿区,历史上发生奥灰水突水事故较少。在该区域奥灰水害远距3煤