基于环境约束的视觉数据分析

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:wangxd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会的发展,尤其是数字化信息和移动互联网的普及,为计算机视觉提供了大量的数据和应用场景。然而,即使目前最先进的计算机视觉系统也仍然在很多任务下和人类视觉系统相差甚远;与此同时,很多现有的计算机视觉方法专注面过于狭隘,没有考虑到数据之间的联系及其和环境的相互关系,因而容易犯一些低级错误。  本文详细挖掘了计算机视觉中的环境约束信息,着重研究了深度信息约束、拓扑结构约束和时空一致性约束,本文的研究内容和主要创新点如下:  1、提出了一种基于深度信息约束的图像分类模型。该方法构建在传统的词包模型基础之上,首先利用马尔可夫随机场估计图像像素的深度信息,再将此深度信息嵌入到图像特征中。在共聚集的过程中,我们将图像特征投影到在深度方向上临近的两个深度平面上,从而使得原来在特征空间无法区分的特征得以在深度空间被正确地分类。所提方法在图像分类,尤其是场景图像分类任务中,表现要优于传统的词包模型和时下一些最新的方法。  2、提出了一种基于拓扑结构约束的步态识别模型。拓扑结构是形状类数据的固有属性,对于步态数据来说,无论行走姿态和视角如何变化,其拓扑结构都未曾发生改变,这就是拓扑不变性的优良特性。与此同时,拓扑不变性缺乏足够的判别力,我们无法利用拓扑不变性来区分结构相似而类别不同的物体。有鉴于此,我们利用持续同调理论在多分辨率和多视角下追踪步态的局部拓扑结构变化,增强了拓扑不变性的表达力,使其适用于计算机视觉的识别任务。实验表明,在跨视角、跨姿态的情况下,该拓扑特征的性能要远远超过传统的步态特征。  3、提出了一种基于时空一致性约束的行人再识别方法。目前的行人再识别研究主要集中在特征学习和度量学习两方面,大部分之前的工作只专注于其中一项;在本文中,我们利用深度神经网络将特征学习和度量学习统一在一个框架下,进行端到端的训练和推理。在特征学习阶段,我们利用基于时序的注意模型来自动挑出具有判别力的帧,使其在特征学习阶段具有很大的权重;在度量学习阶段,我们首先逐位置计算一对视频的相似度,然后利用基于空间的循环神经网络来考虑空间上下文的信息,使得相似性度量具有空间一致性。
其他文献
日益严重的荒漠化已经成为全球范围内环境问题的焦点,而其中草场荒漠化的现象更为突出,本文对草场荒漠化的关键因素及驱动机制进行了建模分析,模拟展现了草场荒漠化过程中的突变
自适应动态规划(Adaptive Dynamic Programming,ADP)结合了现代控制理论中的最优控制和自适应控制、计算智能中的人工神经网络以及机器学习中强化学习的思想,可以解决传统动态
四足机器人机动性高、环境适应性强,在灾难救援及特种作战等领域具有重要应用价值。其数学模型具有非线性强耦合的特点,建模及控制难度大,特别是在未知不确定环境中运动时,四足机
随着社交媒体的快速发展,来自互联网的评论观点,越来越多地影响着组织和个人的购买决策制定、选举投票和市场产品设计等事宜。对于商业和个人,正面的评论观点常常意味着更高的利
随着Internet的迅速发展,基于Internet的电子商务受到人们的普遍关注,网络银行作为一种高效率低成本的网上交易手段得到了广泛地应用。网络银行系统的安全可靠是保障电子商务
随着工业4.0概念的提出和中国制造2025战略的推进,高性能的工业机器人作为制造领域的核心装备成为了我国制造业转型升级迫切需要的国之利器。交流伺服系统作为工业机器人核心
推进器是水下机器人运动的核心,对水下机器人完成水下作业,顺利回收起着至关重要的作用。传统的推进器驱动系统采用集中式控制方式,具有可靠性低,不利于系统的装配、调试、故
学位
模块化机器人具有构型复杂多变、可适应多种任务需求等特点,是近几年国内外机器人领域一个重要的研究热点。本文以国家“863”计划重点课题“机器人模块化设计过程仿真演示系
学位
无人直升机能适应复杂多变的环境,具有无人员伤亡、隐蔽性好、战场生存力高等优势,在军事和民用上有着广阔的应用前景。   本论文是在中国科学院合肥智能机械研究所重点创
学位
本文受仿生学和群智能算法的启发,针对一类多关节仿鯵科机器鱼,应用微粒群算法(Particle Swarm Optimization,PSO)对其进行运动控制优化。   首先,介绍了仿生机器鱼及其运动控