【摘 要】
:
人体行为识别技术是随着深度学习成熟与普及后取得迅速发展的重要计算机视觉技术之一,是极具现实与经济需求的关键技术。与以单帧图像为载体的图像识别、图像融合以及图像风格迁移转换等相比,人体行为识别具有数据量更大、任务更复杂以及场景更多样等特点,因此人体行为识别难度相应更大。文本在现有人体行为识别研究的基础上,选取视频中的特定帧以及特定帧中的部分图像块,凸出人体行为中运动的语义主体信息,并在深度学习的基础
论文部分内容阅读
人体行为识别技术是随着深度学习成熟与普及后取得迅速发展的重要计算机视觉技术之一,是极具现实与经济需求的关键技术。与以单帧图像为载体的图像识别、图像融合以及图像风格迁移转换等相比,人体行为识别具有数据量更大、任务更复杂以及场景更多样等特点,因此人体行为识别难度相应更大。文本在现有人体行为识别研究的基础上,选取视频中的特定帧以及特定帧中的部分图像块,凸出人体行为中运动的语义主体信息,并在深度学习的基础上,通过与传统算法特征进行融合,达到提高视频特征表征能力,降低网络的复杂度并提升行为识别精度的目的。本文在现有网络的基础上,通过融合深度学习与传统算法特征,加大动作之间的区分度,降低数据规模,提升人体行为识别的速度与精度。主要的工作内容如下:(1)提出基于关键帧选择的快速人体行为识别方法。3DCNN中直接对视频图像帧序列取固定的帧长,进行网络训练。受此启发设计基于关键帧选择的算法输出固定长度的视频特征信息,进而进行行为识别。本算法首先对行为识别图像帧序列逐帧进行特征提取,之后通过关键帧排序得到固定长度的视频特征,然后通过二次排序恢复图像时域信息,再然后通过特征重排列构造固定长度的结构化特征,最后将重排列后的特征经过LSTM学习,提高行为识别精度。在UCF101上的实验结果说明了本章算法的有效性。(2)提出基于背景抑制的人体行为识别方法。既然只选取部分的帧就足够完成对视频的表征,那么通过选取图像帧中有限的图像块理应具有同样的作用。本章借鉴目标检测中的研究思想,首先通过对输入网络中的视频进行低秩稀疏重建,然后采用Unet进行人像区域检测,抑制动作背景信息,达到一方面提高动作之间的区分度,另一方面突出占图像区域比较小的动作在整张图中的权重的目的。算法最后结合动态图方法对固定长度的图像序列动态加权,达到凸出运动主体、降低数据量且提升特征的表征能力,进一步提高行为识别精度的目的。(3)提出基于背景融合的人体行为识别方法。直接通过背景抑制的方法对输入网络的图像进行处理,破坏了动作的上下文信息,不具有视觉上的可解释性。本章在基于背景抑制的人体行为识别算法基础上,首先利用动态图算法,完成去背景图像与含背景图像的融合,最后将融合了背景信息的动态图送入Res Net学习。网络一方面具有背景抑制中凸出前景动作的效果,另一方面保持了完整的动作上下文背景信息,从而提高了行为识别分类精度。
其他文献
近年来,随着移动设备和物联网节点数量的快速增长,数据流量需求随之增长,业务的多样性增加,未来的网络服务将朝着更加稳定、更加灵活、覆盖范围更加广泛的趋势发展。除了流量的需求,也有对网络普及性的需求,在某些偏远地区、受灾地区、快速移动的平台上等都需要完成更全面的通信资源部署并且保证更连续的通信服务。在这种情况下,传统的地面蜂窝网络并不能很好地达到无缝通信的目标,且当遇到特殊天气或灾害等情况容易损坏,因
邮轮产业是促进国家制造业转型升级、落实《中国制造2025》战略的重要组成部分,提升国产邮轮自主建造能力对我国船舶高端装备产业发展具有重要意义。邮轮建造物资具有种类繁
目的:通过致孔策略研制压片关键性能改善的多孔中药粒子,以解决中药提取物在压片中遇到的压缩性差和片剂溶出慢的问题,扩大片剂剂型在中药中的应用。方法:首先,以压缩成型性和崩解时限/溶出度为指标,选出合适的模型药、致孔方式和致孔剂。其次,对内外致孔和表层致孔两种致孔方式进行细化研究,比较模型药致孔前后在粉体学性质及其片剂性能上的差异。最后,对具有更好应用前景的表层致孔多孔粒子进行稳定性研究和片剂生产适用
随着当前社会主要矛盾转变为人民日益增长的美好生活需要和发展不平衡不充分之间的矛盾,中国的经济发展模式正式进入了转型阶段。“抓创新就是抓发展,谋创新就是谋未来”,诸如此类的说法被人们广泛接受,并逐步受到国家的重视。我国政府一直很重视创新的重要作用,提出了建设创新型国家的重要战略。企业是市场的主体。企业的创新对于整个国家来说有着极为重要的意义。在此基础上,我国政府颁布了一系列的企业所得税税收优惠政策,
随着社会的发展与科技的进步,智能化已成为车辆发展的主要方向。智能车辆是一个集中应用计算机技术、通讯技术、传感技术、人工智能与自动控制等技术的综合体,其核心包括环境
随着时代的发展和环保意识的提高,人们越来越重视空气污染问题。相关机构设立了大量环境监测点,有效地测定了空气中污染物的浓度,为我们提供了大量的数据支持。对测定的空气污染浓度数据进行分析预测,能有效指导大气污染防治措施的制定。为了能够进一步提高空气污染浓度预测的精度,本文综合分析了空气污染数据的时空特征和多种污染物之间的相关性,提出了新的污染浓度预测模型。本文主要的研究内容如下:(1)数据预处理与相关
车牌识别作为智能交通管理系统的核心内容之一,反映了智能交通系统的发展速度和技术水平。传统车牌识别方法分为车牌定位、字符分割和字符识别三个模块,模块之间的误差容易影响后续处理,进而影响最终的识别率。同时,传统车牌识别技术对于图像质量要求较高,对于车辆运动、光照变化、拍摄角度等因素比较敏感,车牌图像出现模糊、光照过暗和倾斜等现象时均影响识别率。目前深度学习算法在图像识别、语音识别等领域取得了长足进步。
Pt基、Pd基贵金属纳米材料具有优良的光学、电学、催化性能等特性,因此在催化、光学、电学、生物等领域有着广泛的应用前景,然而贵金属钯铂由于价格昂贵且在自然界中含量少、应用于燃料电池中易催化中毒且稳定性不太好,因此对其掺杂非贵金属形成合金催化剂受到了很多研究工作者的青睐,而纳米合金催化剂又与合金催化剂的组成元素、组成成分、形貌、尺寸有关,因此,需要对纳米合金催化剂做很多相关研究。本文以合成形貌尺寸均
轴承作为高速列车传动齿轮箱关键零部件,长期服役在高转速、高振动的工作环境,其工作性能将直接影响齿轮箱及列车运营的安全性和可靠性。为保证齿轮箱及其内部重要零部件的平稳可靠及安全运行,对其内部主要支撑轴承的动载荷分布特性进行深入的台架试验研究,从而对监测评估齿轮箱运行状态、优化齿轮箱结构设计和轴承设计、提高高速列车运营的安全性意义重大。本文针对我国CRH380B型高速动车组动力转向架传动齿轮箱内型号为
珠三角港口群直接依托我国对外开放最早、外向型经济高度发达的珠三角经济区,是珠三角经济区经济社会发展的重要支撑,现有包括广州港、深圳港在内的港口9个。多年来,珠三角港口群取得了快速发展,在全国港口体系中的地位日益突出。目前国内学者对珠三角港口群的研究较多,但主要着眼于港口物流体系规划、港口竞争合作分析、港口建设生产发展规划等,鲜有对珠三角港口群空间结构演化的相关研究。总结珠三角各港口的发展规律,为珠