基于多镜头转换GAN的行人重识别研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:jqk1981fjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是近年来在计算机视觉领域兴起的一项新技术,它是许多安防和监控应用中的重要任务,在计算机视觉研究领域上也引起了越来越多的关注。行人重识别指的是在非重叠镜头视域中检索出目标行人。由于多个镜头拍摄的场景和拍摄角度是完全不相同的,假设我们要对某个镜头中拍摄到的目标行人进行重识别,即在其他的镜头中检索该行人,除了要考虑目标行人本身在不同镜头下外观上的不同,还要考虑其他行人的影响,比如该目标行人需要与其它镜头中的多个行人都进行比较。随着生成对抗网络模型的提出和相关算法的不断演变,基于生成对抗网络的行人重识别研究也取得了良好的进展,利用生成对抗网络生成的图像进行网络模型训练,很好的提升了性能。目前,行人重识别在单个数据集下的性能已经有了显著的提高,但在一个行人数据集下训练的模型,常常不能很好的推广到另一个行人数据集。本文的主要工作如下:(1)由于行人重识别也是图像检索的子问题,本文了引入了细粒度图像检索的思想。本文提出了混合选择性卷积描述符聚合的方法,该方法将选择性卷积描述符聚合的特征与全局平均池化特征相结合,得到最终的行人特征。这种方法可以选择有用的深度描述子,同时通过定位图像中的行人目标来滤除背景噪声。(2)本文提出了多镜头转换GAN(Generative adversarial networks),一种图像到图像翻译的方法。该方法用单个模型对行人数据集多个镜头领域执行图像到图像的转换,即将源数据集的图像转换为目标数据集中多个镜头的风格,并保留了原始图像的标注信息。同时,对于特征学习模型,使用了上述的混合选择性卷积描述符聚合的方法,定位图像中的主要行人目标,滤除背景噪声,保留有用的深度描述符,从而提高检索准确率。
其他文献
3μm波段光纤激光器在基础科学研究、环境检测、生物医疗以及国防安全等领域有着重要应用。利用稀土离子掺杂ZBLAN(ZrF_4-BaF_2-LaF_3-AlF_3-NaF)玻璃光纤作为增益介质,已实现数十瓦量级3μm波段激光输出。然而稀土离子在该波段发光效率较低,探索提高稀土离子发光效率的方法有助于进一步提升3μm波段光纤激光器的性能。本论文选取具有较低声子能量的氟化铟基玻璃作为基质材料,围绕Ho3
金字塔股权结构广泛存在于我国上市公司中,作为资本市场的重要特征之一,其对我国资本市场运作及公司治理均产生着显著的影响。因此,对金字塔股权结构的成因及后果进行研究具有重要意义。在金字塔股权结构的成因方面,学术界主流的观点为“控制权私利论”及“融资优势论”,但有学者提出,我国地方国有企业金字塔股权结构的形成是地方政府权力下放所致。由于我国独特的政治及经济制度,政府可通过行政手段对地方国有企业施加重要影
多项式优化问题是非线性规划中的一类重要问题,近二十年来其理论与算法已得到深入发展.本文利用多项式优化中已有的经典理论和算法,研究了无约束多项式局部鞍点值排序问题和
石墨相氮化碳(g-C3N4)是一种非金属聚合物半导体材料,具有合适的能带位置、可见光活性以及稳定的物理化学性质,这些特性使其成为光催化领域的研究热点。然而,块状的g-C3N4存
经过二三十年的发展,我国的公益慈善事业进入了一个快速发展的新时期,它在推进中国社会转型与改革、构建和谐社会的过程中发挥着越来越重要的作用。随着互联网公益的发展,我国公民的公益慈善意识逐步觉醒,但总体来说普及率还比较低,民众的公益文化价值观和参与意识还有待提高。作为一个相对特殊的报道领域,公益报道因为处在比较边缘的位置,所以受重视的程度较低,报道内容比较有限,媒体公益报道的社会功能没有得到充分发挥。
非刚性运动恢复结构(Non-Rigid Structure From Motion,NRSFM)技术,通过利用二维图像序列中的特征点,能够估计出物体的三维结构及相应的运动参数,是实现物体三维重构的一种重要途径。当图像序列中的样本较少时,即小尺寸图像序列,目前已有的NRSFM算法,性能会显著下降。这是因为少量数据只能建立起来有限的方程组数,而自变量数目相对多,难以求解最优解。此外,当NRSFM用于单
随着人们生活水平的提高,医疗科学的不断发展,人类越来越长寿。老龄人口的增长数量和速度都不容忽视,持续的人口老龄化是不可避免的趋势。我国人口基数大,虽然现在仍有人口红利使各种矛盾没有凸显的很严重,但也需要引起我们国家的重视。老年人占人口比重的提高给社会带来了养老压力、劳动力不足、养老金缺口等一系列问题。如何将老龄化的负面影响转化为正面影响是我们亟需解决的问题。鼓励老年人再就业,发挥自己的余热,是其中
在申请专利时,专利审查员需要确定申请专利的现有技术,以确定该专利的新颖性。对于专利组织来说,如何高效准确地为给定专利推荐引文是一件非常重要的事。传统的专利引文推荐需要大量的人工审查,十分耗时。为减少人工以及节省时间,有研究人员利用计算机技术自动为专利推荐引文。然而,许多研究仅考虑专利的文本信息,忽略专利文档所具有的丰富的结构信息,而这些结构信息在进行专利引文推荐时也非常重要。此外,大多数研究工作仅
伴随着通讯技术的不断成熟,与通讯相关的使用场景也愈加宽泛。一方面,人们享受着科技带来的丰硕成果,无线网络技术得到飞速发展,但另一方面,制度和监管的相对缺失,使得很多围绕无线通讯的“黑色产业”造成了许多负面的影响,例如手机的垃圾短信就始终困扰着人们的生活。为了对手机的垃圾短信进行检测识别与过滤,对当前基于文本分类技术的垃圾短信过滤方法进行了研究,详细介绍了文本分类过程中的预处理技术和特征提取技术,并
创新对于中小企业生产率的提升和国家的进步都有至关重要的作用。本文以世界银行网站对加纳的四个地区(阿克拉、北塔马莱、特马和塔莫拉迪)的企业调查数据为样本,对创新与生产力的关系展开研究。研究结果表明,创新对加纳中小企业的运营存在正向影响。这进一步证实了具有创新能力的中小企业更容易获得竞争优势的结论。同时,本文对中小企业创新性的影响因素提出不同见解。以前学者的研究指出,大企业比小企业更具创新性。但本文的