基于多粒度区域相关深度特征学习的行人重识别

来源 :计算机科学 | 被引量 : 0次 | 上传用户:q18198837
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在对行人重识别的研究中,联合使用从图像中提取的全身与局部特征已经成为当前的主流方法.但是许多基于深度学习的重识别模型在提取局部特征时忽略了它们在空间上的相互联系,当不同行人具有局部相似的外观时,这些局部特征的辨别能力会受到很大影响.针对该问题,提出了一种学习多粒度区域相关特征的行人重识别方法.该方法在对骨干网络提取的卷积特征张量作不同粒度的区域划分后,设计了区域相关子网络模块来学习融入空间结构关系的各局部区域特征.在区域相关子网络模块中,为了赋予局部特征与其他区域相关联的空间结构信息,综合利用了平均池化运算的空间保持能力与最大池化运算的性能优势.通过对当前特征和其他各区域的局部特征进行联合处理,使各局部特征间产生很强的空间相关性,提升了特征判别能力.在区域相关子网络模块的设计上,采用了与深度残差网络相同的短路连接结构,使得网络更易于优化.最后,由全身特征与使用区域相关子网络增强后的各局部区域特征联合实现行人重识别.Market-1501,CUHK03,DukeMTMC-reID 3个公开数据集上的实验结果表明,所提算法取得了优于当前主流算法的行人身份匹配准确率,具有非常优秀的重识别性能.
其他文献
大数据时代,由于信息过载,用户很难从海量数据中寻找出感兴趣的内容,个性化推荐系统的诞生极好地解决了这个问题.协同过滤算法被广泛应用于个性化推荐领域,但由于模型的限制,推荐效果未能得到进一步提升.现有的基于协同过滤模型的改进方法大多都是通过引入表示学习方法来得到更好的用户表示向量和项目表示向量,或通过改进用户项目匹配函数来提升推荐能力,但此类工作都致力于从单个交互提取用户-项目交互信息.文中提出了一种多空间交互协同过滤推荐算法,将用户向量和项目向量映射到多空间,从多角度做用户-项目交互,使用两层注意力机制聚
可靠的区域出行需求预测能够为交通资源的调度和规划提供合理有效的建议.但是,出行预测是一个非常具有挑战性的问题,面临海量的时空大数据建模问题,如何有效地提取时空大数据中的空间特征和时间特征,成为当前城市计算的研究热点.文中提出了一种基于3D卷积和编码-解码注意力机制的需求预测模型(3D Convolution and Encoder-Decoder Attention Demand Forecasting,3D-EDADF),用于同时预测城市区域的出行需求流入量和流出量.3D-EDADF模型首先利用3D卷积
微博用户兴趣发现对社交网络的个性化推荐和信息传播的正确引导具有重要意义,因此提出了一种基于多粒度文本特征表示的微博用户兴趣识别方法.首先,从主题层、词序层和词汇层3个方面对微博用户构造文本向量,利用LDA提取内容的主题特征,通过LSTM学习内容的语义特征,引入腾讯AI Lab开源词向量获取词义特征;然后,将以上3种特征向量拼接得到的多粒度文本特征表示矩阵输入CNN中,进行文本分类训练;最后,通过多端输出层实现对微博用户的兴趣识别.实验结果表明,多粒度特征表示模型的分类实验结果比单粒度特征表示模型的精准率、
网络表示学习的目标是将网络中的节点嵌入到低维的向量空间,为下游任务提供有效特征表示.在现实场景中,大规模网络通常具有不完整的链路,而现有的大多数网络表示学习模型都是在网络是完整的假设下设计的,因此其性能很容易受到链路缺失的影响.针对该问题,文中提出了一种基于不完全信息的深度网络表示学习方法DNRL(Deep Network Representa-tion Learning).首先采用转移概率矩阵将结构信息和属性信息进行动态融合,弥补了结构信息不完整带来的过大损失,然后采用一种具有强大特征提取能力的深度生成
属性网络不但包含节点之间复杂的拓扑结构,还包含拥有丰富属性信息的节点,其可以比传统网络更有效地建模现代信息系统,属性网络的社区划分对于分析复杂系统的层次结构、控制信息在网络中的传播和预测网络用户的群体行为等方面具有重要的研究价值.为了更好地利用拓扑结构信息和属性信息进行社区发现,提出了一种基于矩阵分解的属性网络嵌入和社区发现算法(CDEMF).首先提出基于矩阵分解的属性网络嵌入方法,基于网络局部链接信息计算相邻节点的相似性,将其与属性接近度联合建模,通过矩阵分解的分布式算法得到每个节点对应的低维嵌入向量,
为了提高复杂网络链路预测的性能,采用拓扑相似和XGBoost算法来完成复杂网络链路预测.利用复杂网络拓扑结构建立邻接矩阵,求解共同邻居集合,然后根据拓扑相似理论计算复杂网络相似得分函数,将各个时间窗的得分函数和权重参数作为输入,采用XGBoost算法实现复杂网络的链路预测.通过差异化设置XGBoost算法的两个正则化系数,测试其对链路预测准确率的影响,获取最优正则化系数,从而得到稳定的XGBoost链路预测模型.实验证明,时间窗数量设置合理的情况下,相比常用网络链路预测算法,基于拓扑相似和XGBoost算
《2020年中国智能物联网(AIoT)白皮书》显示,随着我国5G网络的迅猛发展,大容量低价格的IoT(Internet of Things)传感器设备快速普及,数据呈爆发性增长,图像处理在物联网的诸多领域(如智慧城市、智慧交通、智慧医疗等)得到了广泛应用.在这些领域研究中,科研人员往往相对轻视数据收集过程中的实际问题,如天气变化、季节迁移、昼夜交替等时间变化带来的图像数据退化,以及随着物体移动、叠加、模糊、部分遮挡等诸多空间变化带来的噪声问题.其中,以雨天为代表的复杂天气下的图像模糊问题非常常见,也最具挑
自然场景下的文本信息通常具有多样性和复杂性的特点.由于采用手工设计特征的方式,传统的自然场景文字检测方法缺乏鲁棒性,而已有的基于深度学习的文本检测方法在各层网络提取特征的过程中存在丢失重要特征信息的问题.文中从多粒度和认知学的角度,提出了一种结合多粒度特征融合的自然场景文本检测方法.该方法的主要贡献是通过对通用特征提取网络的不同粒度特征进行融合,并加入残差通道注意力机制,使得模型在充分学习图像中不同粒度特征信息的基础上,更加关注目标特征信息并抑制无用的信息,提升了模型的鲁棒性和准确率.实验结果表明,相比其
文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文
有效地对夜间车辆违规使用远光灯的行为进行管理,可以降低夜间交通事故的发生,但目前缺乏高效的远光灯检测方法,相关交通法规无法得到有效执行.针对此问题,文中提出了一种夜间车辆远光灯检测深度学习算法.该算法基于YOLOv3进行设计,通过降低各层卷积层维数的方式,来减少整体网络的参数量,提高算法的运行速度;然后对网络的残差组件进行改进,使用标准的残差组件,同时设计了一个空洞卷积模块来加强网络局部和全局特征的融合,增强了网络的特征表达能力;接着对YOLOv3的损失函数进行了改进,优化小尺寸目标对坐标损失的贡献,增强