【摘 要】
:
行人重识别作为智能视频监控分析的关键任务之一,可以自动地对来自多个摄像机视角下的行人图像进行匹配。由于其在智能监控、行人跟踪、行人图像检索等方面的重要性,近年来得到了广泛的关注,并取得了显著的进展。然而,大多数现有方法的训练和测试通常是有监督的,并在单个标记数据集上进行。由于数据集之间的差异,如果将在一个数据集上训练的模型直接部署到另一个数据集上,可能会导致识别精度的显著下降。这意味着这种有监督的
论文部分内容阅读
行人重识别作为智能视频监控分析的关键任务之一,可以自动地对来自多个摄像机视角下的行人图像进行匹配。由于其在智能监控、行人跟踪、行人图像检索等方面的重要性,近年来得到了广泛的关注,并取得了显著的进展。然而,大多数现有方法的训练和测试通常是有监督的,并在单个标记数据集上进行。由于数据集之间的差异,如果将在一个数据集上训练的模型直接部署到另一个数据集上,可能会导致识别精度的显著下降。这意味着这种有监督的单域行人重识别方法在实际应用中具有有限的可扩展性,并且在实际应用中常常缺少特定于数据的标签。通过大量研究发现主要是以下两个问题导致现有方法的可扩展性较差:1)不同数据集间存在很大的差异,将在一个或多个数据集上训练的模型直接应用到测试数据集,会产生严重的域偏移问题;2)缺乏测试数据集的行人标签信息,与基于有监督学习的方法相比,这类方法的识别率会低很多。因此,本文针对上述提出的两个问题进行了相关性研究,并取得一些研究成果如下:(1)为了解决可扩展性问题,提出了一种基于属性-身份嵌入的自监督学习算法,通过从目标域中选择未标记的样本来逐步优化模型,从而弥补源域和目标域之间的差距。具体来说,首先提出了一个属性-身份联合预测字典学习模型,用于同时学习潜在属性字典、语义属性字典和身份鉴别器。该方法利用潜在属性空间中的预测属性作为桥梁,在不同域之间建立一个初步的连接,从而预测目标域样本的标签。其次,为了挖掘预测样本所包含的潜在身份信息,提出了一种预测-训练循环自监督学习来调整模型变量,使其在目标域中更具有适应性。最后,将属性空间与潜在身份空间相结合,实现了行人的相似性度量。(2)为了消除数据集自带的域信息以及行人姿态信息的影响,提出了一种基于矩阵分解和超图结构对齐的字典学习算法。具体来说,模型主要包括两个新颖的成分:(a)基于矩阵分解的思想,将原始的视觉特征分解为姿态不变成分、域信息成分及干扰信息成分,目的是为了提取不受域信息和行人姿态信息影响的视觉成分,同时还进一步消除了行人之间的干扰成分对识别的影响;(b)为了进一步提高算法的适应能力,考虑到语义属性的域不变性,通过引入超图结构对齐约束来建立姿态不变特征和语义属性的关系,以便后期能准确预测目标数据的行人属性,最终联合行人的姿态不变特征和语义属性实现行人相似性度量。
其他文献
随着社会的进步和科技的发展,应用场景逐渐多样化,人们更加需要同时具有波束自动跟踪能力和一定隐身能力的高性能天线来实现更丰富的功能。Van Atta天线阵列作为方向回溯阵列天线的一种,具备方向回溯特性的同时,还可以实现对雷达散射截面的控制,在保证工作性能的前提下,提高隐身性能。但如果来波方向与阵列之间的角度过大,会导致回溯波无法准确沿入射波方向发射,性能急剧下降。因此,回溯角度是重要性能指标之一,宽
人类眼球所处的状态和运动轨迹称为眼动信息,眼球运动的信息与人类心理、行为特征都有紧密关联,能实时地反映人类的心理变化及意识倾向。目前最为常见的是基于PC机的眼动检测
C-H键官能化反应是一种通过活化C-H键实现官能团直接引入的方法,近年来被广泛应用于C-C/C-X(X=C,N,S,O等)键的构筑。C-H键的直接官能化可实现目标分子的一步合成,避免对底物的预官能化反应,减少了化合物的合成步骤,提高反应的原子经济性。将C-H官能化方法应用于构建活性中间体的先导骨架,合成具有多样活性的化合物或者具有成药潜力的化合物,对于药物化学领域的研究具有重要意义。芳基甘氨酸及氨
在大数据时代背景下,网络上的信息量呈爆炸式增长。丰富的信息资源为人们提供了诸多便利,同时产生的信息过载问题也增加了用户获取真正感兴趣信息的难度。为了解决用户的有限需求与海量数据之间的矛盾,推荐系统应运而生。其中协同过滤推荐算法作为应用最为广泛的推荐算法之一,凭借其优秀的推荐质量,获得了众多学者的青睐。传统的协同过滤推荐算法根据用户历史行为数据挖掘用户偏好,通过寻找与目标用户相似度较高的用户群体,计
大数据及其技术的应用带来了新一轮的政府治理变革创新,成为智慧政府治理的重要背景和条件,对政府的治理理念、治理结构、治理方式、治理模式与治理过程等方面都产生了重要影响。为了更好地掌握时代发展态势,实现政府治理体系和治理能力的现代化,政府应当更具“智慧”,汇聚政务大数据,打造高效能的智慧政务;建立数据驱动的决策支持系统,提升政府决策精确性;实现精细化数据管理,加速智慧服务建设;完善智能化数据监管体系,
随着数字时代的高速发展,自然语言处理现已广泛集成到Web和移动应用程序中,实现人与计算机之间的自然交互,其学科范围广泛,比如语音合成与识别、机器翻译、句法分析等等,而文字在这些研究领域中具有至关重要的作用。文字常常以报纸、电子刊物,及其网站等方式在人群中进行传递,给人民生活带来了便利,同时这些庞大的信息也令人眼花缭乱。而在这海量的文字信息中,难免也会有各种各样的错误。传统的人工校对方式在人力,物力
随着我国在互联网技术领域的不断进步,第三方支付平台应运而生,改变了传统的交易方式。第三方支付机构因其具有信用中介性、金融性和隐蔽性等特征,为电子商务的交易承担着信用担保的责任。目前,我国第三方支付产业已经进入审慎发展阶段,未来将朝着不断创新、更加安全规范的趋势发展,但是在其发展的过程中也衍生出一系列的法律问题。虽然我国对于第三方支付的监管正处于不断完善之中,但是仍存在诸多问题。在第三方支付信用额度
红外成像传感器具有捕捉物体热辐射的能力,但对场景纹理细节信息的变化不具有敏感性。可见光成像传感器具有捕捉场景空间细节信息的能力,但容易遭受周围恶劣环境的影响。因此,融合红外与可见光图像可以捕捉各波段互补特征,显示辐射目标并保留场景信息。红外与可见光图像融合技术在情报收集、监控安全以及航空航天等领域具有广泛的应用前景。为了提高红外与可见光图像的融合质量,本论文主要基于多尺度变换、卷积稀疏编码以及卷积
网络空间测绘是网络规划、可视化、网络安全以及故障诊断的基础。目前对拓扑测绘的研究主要分三个方面:实体设备扫描;逻辑拓扑探测;属性标注。在测绘特定地区网络拓扑时使用的方法包括IP地址定位技术、路由器定位技术以及边界网关IP地址识别技术。IP地址地理定位是网络拓扑测绘的基础,由于IP地址与地理信息无直接关系,如何准确定位IP地址是一个难点,现在主要通过分析注册信息、利用网络拓扑图或者搜集用户位置信息等
高光谱图像分类是遥感领域的热门研究方向,在矿物学、农学、城市规划、环境科学和军事等领域有着巨大应用价值。高光谱图像由数百个具有丰富空间和光谱信息的光谱波段组成。在训练样本有限的情况下,高光谱图像的高维度光谱信息可能导致“维度灾难”,如何有效地利用高光谱丰富的空谱信息成为高光谱分类的主要研究内容。考虑到高光谱数据集的收集代价较大,小样本情况下的特征提取问题也是高光谱分类任务的研究难点。基于上述分析,