基于时序特征和注意力的人体行为识别研究

来源 :淮北师范大学 | 被引量 : 0次 | 上传用户:jaz23cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着运算能力的大幅提升,基于深度学习的人体行为识别技术成为计算机视觉相关领域的研究焦点,被广泛应用于人机交互、智能监控和虚拟现实等领域。人体行为识别技术相比传统的图像检测技术,需要处理时序信息,仍存在许多建模优化问题。首先,人体行为时间跨度长短不一,为时序特征建模带来困难;其次,模型提取的特征未区分不同时间、空间和通道的重要性,研究如何突出重要特征具有重大意义;此外,用于人体行为识别的深度学习模型存在复杂度高的问题。针对上述问题,本文从时序特征提取和注意力机制角度,对使用RGB视频帧为输入的人体行为识别任务展开研究。主要工作如下:(1)提出了一种基于时序聚合激励的人体行为识别模型。针对人体行为识别算法中时序特征提取困难的问题,该模型在主流二维卷积神经网络提取的空间特征基础上,先通过运动激励模块计算相邻特征图之间的差异,提取特征级运动信息;再通过全局时间聚合模块,对时间维度上所有输入特征图进行计算,提取全局时间信息,因此该模型可以有效提取时序特征。由于采用二维卷积神经网络作为主干网络,模型的复杂度相对较低。通过在UCF-101和HMDB-51两个行为识别数据集上进行实验,模型准确率分别达到96.6%和72.8%,超过了大多数行为识别算法,证明了该模型的有效性。(2)提出了基于时间、空间、通道的注意力模块。深度学习网络提取的视频特征在不同时间、空间和通道维度上对行为识别重要性不一致。如果网络对提取到的特征不加以区分,就会引入噪声,无法突出贡献度高的重要特征,导致网络识别性能下降。本文提出的注意力模块以空间注意力机制和通道注意力机制为基础,并引入时间信息提取机制,形成对应的时间-空间注意力机制和时间-通道注意力机制,从而解决传统注意力机制没有考虑时间维度信息的问题,或者单独考虑时间信息,未将时间信息与空间和通道信息相结合的缺点,让网络能在提取人体行为特征时更具有针对性。为了验证该注意力模块的有效性,在多个基线网络上进行实验,网络性能均得到显著提升。此外,将该注意力模块添加到第三章的时序聚合激励网络模型中,在UCF-101和HMDB-51两个数据集上进行实验,模型准确率分别提高了0.3%和0.5%,进一步证明了该注意力模块的有效性。
其他文献
虽然ChatGPT等通用人工智能技术的发展引起了广泛的社会关注,但人工智能基础教育却面临着诸多困境。本文简要总结近年来人工智能基础教育探索中形成的共识和分歧,理性反思当前所面临的困境和挑战,最后从亲身经历的实践者角度提出若干策略建议,为未来的人工智能基础教育提供指导。
期刊
教育是一种具有相对独立性的社会活动,以接受教育为主要内容的受教育权也具有相对独立的发展特性。作为一种保障个体获得终身成长和发展的基本人权,受教育权自诞生之日起就将“平等”和“自由”作为其价值核心,并将促进个体的全面发展和社会的平等和谐作为最终的价值目标。这是受教育权作为一种基本权利根本的、永恒的价值特征。但在不同的历史发展阶段,针对不同的教育类型和受教育群体,受教育权在权利内容、实现方式、权利相对
学位
旧工业建筑安全评级及加固改造一直是国内外学者的研究重点。已有研究的研究对象大多是聚焦于一般旧工业建筑,而鲜有学者对将要评定为工业建筑遗产的具有历史保护价值的旧工业建筑作为一个系统进行研究,专门针对于有历史保护价值的旧工业建筑的结构安全评级和加固方案优选的研究仍然比较欠缺。本文以现存旧工业建筑中结构类型占比最大的钢筋混凝土结构为研究对象,对钢筋混凝土多层旧工业建筑结构安全评级及加固方案优选展开系统研
学位
随着杀菌剂百菌清和多菌灵等化学农药在中国使用量的增大,其残留问题也越来越引起人们的重视。百菌清是一种广谱、保护性杀菌剂,在农业生产中使用广泛,土壤、水体、温室与农产品中检测到百菌清已有许多报道。多菌灵是一种广谱、内吸性杀菌剂,在工农业生产中广泛应用,是杀菌剂类产量和用量最大的品种之一。它在自然界中的半衰期很长,即使在低剂量时就能够对哺乳动物等产生严重的“三致”影响。目前,减轻杀菌剂百菌清和多菌灵在
学位
教育是国家发展的基石,研究生教育作为我国教育体系的重要组成部分,担负着培养高端拔尖创新人才的重任。近年来,我国高等教育普及化不断深化,硕士研究生招生的规模日益扩大。如何在新时代,进一步健全高等教育教学体系、推动我国研究生教育高质量发展是一个重要课题。本研究通过对以往文献的整理分析,以问卷和访谈的调查方式,对教育学类跨学科硕士研究生学情进行了调查研究,剖析学情现存困境及原因,结合学习迁移理论和形成性
学位
半夏是我国重要的大宗中药材之一,入药历史悠久且药效显著,市场供需缺口巨大。高温引发的倒苗是半夏生产的主要限制因素,导致药材产量及品质大幅下降。课题组前期研究中采用半夏高温比较转录组挖掘出包括蔗糖合成酶基因在内的大量差异表达基因。蔗糖合成酶(Sucrose Synthase,SUS)作为蔗糖代谢途径中的关键限速酶,在植物生长发育和响应逆境胁迫过程中都发挥着重要作用,但其在响应高温中的功能尚未清晰。本
学位
文章针对当前中学人工智能教学问题现状,提出应将项目式学习与人工智能教材开发设计相结合,探索突出核心素养、协同区域资源、合理应用编程的教材设计策略,为中学阶段人工智能课程教材设计开发提供实践经验,助力教师人工智能教学能力提升,才能更好地培养学生适应未来发展挑战的能力。
期刊
风机塔在其设计使用期内经受数十亿次的循环荷载作用,不可避免地会发生疲劳损伤,而钢-混组合塔这一新型结构形式则存在较多连接部位,需要对其疲劳损伤及疲劳寿命可靠度进行科学的评估。围绕这一问题,本文开展了钢-混组合风机塔在随机风荷载作用下的时域疲劳及可靠度分析。基于叶素动量方法在FAST-Aero Dyn软件中生成风机叶轮所受的气动荷载,通过AR滤波方法自编MATLAB程序生成了塔筒外表面的风压荷载。建
学位
马铃薯(Solanum tuberosum L.)作为一种主粮及经济作物,营养丰富,在全球范围内需求量大。采后马铃薯在贮存、运输及销售中容易发生绿变,绿变的马铃薯伴随着有毒物质龙葵素生成,导致马铃薯品质下降。光照为引起其绿变的重要因素之一,但其调控机理尚不明确。DNA甲基化是重要表观遗传学修饰手段之一,在植物生长发育和响应环境胁迫中发挥重要作用,但DNA甲基化是否参与调控马铃薯的见光绿变尚不清楚。
学位
随着视频数据的海量式增长,视频理解已成为计算机视觉领域的研究焦点。视频行为识别是视频理解的重要分支,在众多领域中有着广泛的应用。目前基于深度学习的行为识别技术层出不穷,但由于视频数据信息量大,难于建模,仍存在优化空间。视频行为动作之间,变化细微,基于深度学习的行为识别模型难以对动作时序信息进行建模。同时视频中存在大量与行为特征无关的静态背景信息,这会严重影响神经网络对行为特征的建模。为此,本文在分
学位