面向动作分类识别与预测的多样式深度网络研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:yellue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的研究目标是视频中的行人行为识别。行为识别的定义为评估视频给定帧中是否发生了给定动作。由于人类行为(动作,活动)的高度复杂性,例如摄像机角度,行人外观变化,运动方式,遮挡等,使行人动作识别变得复杂。当前已有的部分模型主要依赖于特定的局部时空特征和卷积神经网络去解决此类问题。虽然取得了相对较好的结果,但是仍然存在一些缺陷。为了充分解决由于行人行为复杂而导致的行为识别困难问题,我们提出了如何对局部特征之间的关系尤其是在时空背景下的关系进行建模的方法。在本文中,提出了三种方法来解决这个具有挑战性的问题。在第一种方法中,提出了一种基于密集轨迹和局部时空特征的分类模型。该模型使用经典描述符方式(例如Fisher向量)对特征进行编码。在第二种方法中,和先前的一些进行连续特征学习的无监督解决方案不同,本文以胶囊网络的方式定义这些学习到的特征,因此能够在端到端结构中有判别地优化本文提出的第二个模型,并通过动态路由算法进行权重更新。最后,在第三个方法中,采用可变形卷积网络和自平衡敏感度分段器(Su BSENSE)方法对视频帧进行前景分离,并预测视频中潜在的动作。此解决方案是通用的,无论是基于人工标注还是基于深度学习的方法,都能有效提升网络性能。(1)提出了一种通过结合密集特征轨迹进行动作分类的新方法。该方法不仅利用了传统方法中的形状轨迹信息,还着重于结合运动密集轨迹的信息。在本研究中,视频样本是根据更全面的特征集进行分类的,该特征集引入了运动和形状密集轨迹特征,从而包含了有关视频活动或类别的更多信息。(2)提出了一种基于变型胶囊神经网络的动作分类模型。在该模型中,网络权重不是采用传统默认方式进行更新,而是通过反向传播过程中动态路由损失来更新权重,以确保模型捕获的信息与其表示一致。另外,该模型不需要大量的样本训练,从而与传统方法相比,资源消耗更低。(3)提出了一种用于动作检测、分类与预测的可变卷积序列模型框架。该模型在能够对动作进行分类的同时,还能够对未来活动进行预测。实验结果证明,与传统方法相比,所提模型通过Su BSENSE进行前景提取,并结合可变卷积网络,使得分类与预测性能得到了较大提升。我们的工作表明,与最新的基准或传统方法相比,所提模型取得了显著改进,同时大大减少了所需训练参数和输入的样本数量。实验显示,实时处理视频的能力决定了模型能否在潜在应用中快速识别预测动作。本文提出的所有方法都可以应用于实时系统,并且已通过开发系统或提出解决方案证明其可行性。综上,我们的工作已在动作分类和根据视频内容进行预测的领域中取得了一定突破性成果。该成果的取得得力于模型中考虑的几个关键技术因素:特征轨迹、权重更新、胶囊网络、背景去除和时间信息。同时,与传统方法需要更多的样本集和昂贵的资源相比,本文所提出的模型大大减少了对大量训练数据集的依赖,降低了资源需求。
其他文献
新型信息材料及其相关电子器件的探索与研究,是提升我国自主创新和科研开发水平,推动我国信息科学与技术发展的重要基础。有机电子学得益于在大面积、柔性、高透光性、低污染、低温度和低成本制造等方面的独特优势最近得到了迅猛的发展。新型共轭聚合物半导体材料,尤其是以施主-受主(D-A)聚合物为代表的一系列新型共轭聚合物半导体材料的出现引起了科研人员的广泛关注。目前已经报道的基于新型D-A聚合物的晶体管迁移率已
本文通过对《中华人民共和国个人信息保护法》(以下简称《个人信息保护法》)与《中华人民共和国民法典》(以下简称《民法典》)中个人信息保护制度两者的确立需求、意义、创新点及制约因素的研究,使公民能够清楚个人信息泄露的途径及原因,更好地防止信息的泄露。同时呼吁公民勇于与不法行为作斗争,使公民树立和增强维权意识,清楚个人信息泄露的危害及如何保护个人信息。最终使个人信息问题减少、出现的个人信息问题得到好的救
目的:通过探索幽门螺杆菌(Helicobacter pylori,H.pylori或Hp)相关胃病(H.pylori-related gastric diseases,简称HPGD)胃黏膜组织中上皮钙粘蛋白(E-cadherin)基因(CDH1)单核苷酸多态性(single nucleotide polymorphisms,SNPs)、mRNA表达水平及其蛋白定性定位情况与胃黏膜病理改变及中医证候
我国西部盐渍土地区土壤中含有高浓度的硫酸盐、氯盐、镁盐等腐蚀性离子,加之气候干燥、风沙大、紫外线强,导致当地钢筋混凝土结构出现了腐蚀、开裂等病害,严重降低其服役寿命。国内外学者虽对环境作用下钢筋混凝土的腐蚀破坏开展了一定的研究,但现阶段钢筋混凝土室内加速试验方法还存在一定的不足,关于钢筋混凝土腐蚀破坏的研究缺乏针对性,其腐蚀机理尚未清楚。还需进一步针对钢筋混凝土实际服役环境开展关于混凝土腐蚀破坏过
小菜蛾 Plutella xylostella(L.)(Lepidoptera,Plutellidae)属鳞翅目(Lepidoptera),菜蛾科(Plutellidae),是世界性的十字花科蔬菜害虫,对十字花科作物,包括油菜、花椰菜、甘蓝等,具有毁灭性危害。由于小菜蛾具有寄主植物丰富、天敌缺乏、世代周期短、繁殖能力强,以及抗药性强等特点,目前已成为分布最广泛的鳞翅目害虫,对全球造成的损失以及全球
感知可用性代表了用户对系统的满意程度,是用户对系统的直接评价,也反映了系统的声誉和用户的忠诚度。随着时间的推移,感知可用性的评价会逐渐发生变化,测量感知可用性变化的过程对系统可用性工程具有积极的意义。本研究基于感知可用性、标准化可用性测量量表和纵向研究等相关理论和方法,通过建立中文版系统可用性量表(SUS),数据质量检查方法,以及应对重测效应的SUS复本,构建了感知可用性纵向研究的综合评估方法。具
背景支气管哮喘的主要病理改变是气道黏膜水肿、不同程度的嗜酸性粒细胞和淋巴细胞浸润,其发生机制十分复杂,涉及遗传、环境和免疫调节等多个方面,其中免疫异常或免疫平衡失调在疾病的发生发展中发挥着重要的作用。Th2细胞的优势状态、气道高反应性和组织重塑构成哮喘的特征性三大病理改变。哮喘时呈现的Th2细胞极化状态与多种因素相关,然而这种气道的炎症损伤与Th1/Th2细胞失衡的因果关系及其可能的机制尚不十分清
聚类分析是一种重要的数据分析工具,它根据相似度将数据组织到群集或组中,从而揭示数据的类别属性。最近,很多多核聚类方法被提出,它们使用了存在于多核的多视图补充信息以改善聚类的性能。尽管这些方法取得了一定的成效,但是在一个聚类任务中选择合适的核以及核的重要性仍然具有挑战性。此外,噪声处理也仍未得到优化。考虑到现实世界中的数据大多是非线性的,因此核聚类以及多核聚类在数据挖掘和模式识别中具有广泛的应用。本
微电子元器件的高度集成化和微型化导致热功率密度急剧升高,有效散热成为电子设备稳定可靠运行的关键。在元器件和热沉之间填充高导热性能的热界面材料,有利于降低接触热阻、促进热量耗散,从而保证电子设备在合适的温度范围内运行。因此,研究、开发低成本、高性能的热界面材料成为推动电子产业发展的关键。沥青具有优异的粘接性能和密封性能,且易加工、价格低廉,是极具潜力的热界面材料基体。但沥青热导率低、力学性能弱、耐热