行人重识别中的无监督学习和域适应算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:andy1li
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别旨在不同摄像头下寻找相同行人图像。它在智能安防和智慧零售中具有十分重要的作用。随着深度学习技术的发展,行人重识别模型的识别精度逐渐提升,已经达到较高识别精度。但是这些方法往往需要大量高质量的标注数据训练模型,并且模型易局限于特定的场景,不能很好地泛化到新场景中进行应用,故行人重识别中的无监督学习和无监督域适应问题成为了近年来研究的热点。本文针对这两方面问题,分别提出非对称协同教学网络(ACT)和行人生成与正样本对挖掘(PGPPM)算法。ACT算法通过充分利用类协同教学框架从目标域数据挖掘可靠的样本微调模型,并使用非对称数据流防止模型陷入局部极优,从而使模型能在新场景下仍然保持较高识别精度。PGPPM则针对无监督行人重识别没有标注训练数据的难点,首先训练生成网络生成虚拟数据集,再利用基于协同滤波的正样本对挖掘算法预测行人数据标签,微调模型提升精度。本文的主要工作和创新点如下:(1)针对现阶段行人重识别模型容易过拟合,跨场景识别精度低的特点,提出一种无监督跨域行人重识别方法ACT。该方法使用聚类算法从新场景(目标域)中挖掘训练样本,并借助类协同教学网络结构降低聚类噪声对训练的干扰。本文进一步针对传统类协同教学方法容易陷入局部极优的缺点,设计非对称数据流分别用于两个子网络的训练,进一步提升了域适应精度。(2)针对现阶段行人重识别精度依赖大量标注数据的缺点,提出无监督行人重识别PGPPM算法。该方法首先从大量无标注数据中训练行人生成模型,生成有标签的虚拟数据集,并利用它来初始化re-ID模型。其次,提出一种新颖的基于协同滤波的正样本对挖掘算法挖掘训练样本,最后微调模型。PGPPM通过将真实数据纳入训练过程,在缓解失真虚拟图像带来的负面影响的同时,也进一步提升了模型精度。本文在域适应和无监督行人重识别的多个公开数据集上,对上述提出的算法进行了多个对比实验,实验均取得了目前为止最好的识别精度,验证了本文方法的有效性。
其他文献
目的:临床同种异体移植的成功是以终生服用药物来源的免疫抑制剂为代价的,长期使用免疫抑制剂具有较多副作用。既往的研究表明间充质干细胞(Mesenchymal stem cells,MSC)具有免疫调节功能,在器官移植中可以调节炎症的进程并改善移植物的状态,现有研究证明,MSC在体内外均有免疫调节的作用,且可以延长移植物的存活时间。此外,在临床移植中,MSC已被多次应用并证明其安全性。在本研究中,拟通
T细胞白血病1(T-cell leukemia/lymphoma 1,Tcl1)在白血病中作为原癌基因,已有文献报道Tcl1在肝癌中与戊糖磷酸途径有关。然而,Tcl1是否在结直肠癌(Colorectal cancer,CRC)的发生发展中发挥作用尚无明确报道。因此,我们研究了 Tcl1在CRC中的作用。利用蛋白质免疫印迹(Western Blot,WB)和逆转录-聚合酶链反应(RT-PCR)验证T
当前全球数字化社会建设日益成熟,云服务日渐得到个人、组织机构和大型企业的青睐,可预见未来所有的组织机构都将使用云服务。与此同时,文件共享和文件协作是近六年来使用率最高的云服务类别,这对云服务中文件共享和文件协作、以及文件同步技术提出了更严峻的挑战。针对云同步技术收到的挑战,如何提升云同步性能,为庞大的用户群体提供优质的服务是亟需解决的问题。首先,分析现有云同步技术在大规模应用云服务场景下的同步效率
21世纪进入了信息化的时代,信息化已经进入各行各业,并且信息化技术变成了当今世界上发展最迅速的产业,与此同时,人们对信息化的要求越来越高,对信息化的需求的变化日新月异。我们如何能快速完成项目的上线,如何能快速响应需求的变更一直是各个技术团队希望解决的问题。要解决这个问题,需要拥有一个高效快速的二次开发系统,能让系统更快的投入生产,更能拥抱需求的变更。而一个高效快速的二次开发系统首先系统架构上要整体
随着互联网的高速发展,越来越多的网民在社交平台发表言论,促进了世界的多元化交流。但问题也随之而来,大量的谣言也在社交平台上传播,一些涉及公共安全的谣言,更是对社会稳定造成巨大伤害。然而目前的谣言检测侧重于文本特征、用户信息以及传播结构信息,它们本质上仍然是通过分析用户的发布意图来检测文本的虚假性,却忽略了知识的重要性,在目前谣言数据集数据量少、收集困难的情况下更是影响到谣言检测的性能,因此外部知识
核电站的兴起缓解了当今的日益增长的能源供需矛盾。然而,2011年发生于日本福岛核电站的重大核事故再次使人们将目光集中在核安全的问题上,该事故暴露了燃料颗粒包壳锆合金在高温水蒸气下易发生锆水反应释氢的安全问题。基于该背景下,一种被称为“事故容错燃料”(Accident-tolerant fuel,ATF)的技术概念得以提出。在该技术概念中表面覆膜技术因其成熟的工艺和应用而受到青睐,其中非晶/晶体纳米
人们的日常生活和软件应用服务越来越无法分离。为了应对不断变化的需求,软件开发团队能够快速的对产品进行迭代变得越来越重要。随着微服务、DevOps、容器技术的逐步发展,云原生应运而生,为软件应用服务的快速迭代提供了解决思路。目前谷歌开源了 Kubernetes为容器的管理提供了帮助,但主要是作为容器的编排工具,不能够完全涵盖云原生应用从源代码到发布的整个流程。本文基于Kubernetes实现了一个云
甲骨文,是中国最古老的象形文字,在漫长的汉字发展史上起着举足轻重的重要地位。但要识别未释读的字或者收集、分类相关实例内容是需要花费很多的时间和精力。而利用图像检索技术可以在海量的图像大数据中以较小的时空开销准确地找到一幅相似的图像,图像检索也成为近年来多媒体和信息检索领域的重要研究热点。因此,如何利用图像检索技术对甲骨文图像进行分类与识别的研究也具有非常重要的意义。图像检索的本质是通过对图像进行特
多标签图像分类是图像分类领域的一个重要研究课题,是对单标签图像分类任务的拓展。相对于单标签图像分类任务,多标签图像分类具有更大的复杂性,并且由于标签之间存在一定的相关性,所以探索标签之间的相关性来辅助多标签分类是一个十分有意义的课题。本文以多标签图像分类为目标,重点探索模型各部分蕴含的标签相关性对模型性能的影响。主要基于ResNet骨干网络进行改进,并在基准数据集(MS-COCO和NUS-WIDE
隐喻是一种常见的修辞方式,可以增强语言的渲染能力,提升感官体验,促进说者与听者的共鸣。除了修辞层面上的功能,隐喻更是人类的一种认知手段和思维方式,是人类概念系统塑造的基础。认知和修辞上的功能使得隐喻活跃于各类自然语言交流场景中,同时大量隐晦含蓄的隐喻表达也成为了自然语言处理任务必须直面的一个难点。隐喻计算包括隐喻识别与隐喻理解两大模块。隐喻识别旨在对语料中的隐喻表达加以区分,供后续的隐喻理解模块处