基于深度学习的人群计数算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：wxa180395

【摘要】

：

【作者】

：

陈新雅

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2020年01期

【关键词】

：

深度学习人群计数算法区域关系网络卷积多尺度特征感知模块密度局部关系感知多尺度问题

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人群计数是计算机视觉领域的一个重要研究方向，它在视频监控、公共安全、交通监测等领域有着广泛应用。主流方法通常采用一个全卷积神经网络学习原图到密度图的映射，对密度图进行积分即为人数。本文对基于全卷积网络回归密度图的人群计数算法展开了研究，针对现有方法存在的问题提出了以下改进。
　　多尺度问题是人群计数中的难点问题。大多数先进的方法是通过采用多列结构来解决多尺度问题，这种结构需要消耗巨大的资源成本，因而难以部署多个较深的列，而采用更深的网络已经被证明可以获得更好的效果。因此本文提出以单列网络作为共享主干、从高层提取多尺度特征的结构。在提取多尺度特征时，本文提出尺度金字塔模块，尺度金字塔模块使用平行的不同空洞率的空洞卷积，而不是不同大小的传统卷积以减少参数量。实验表明，与多列结构相比，本文提出的以单列网络作为共享主干、从高层提取多尺度特征的结构可以用更少的参数量得到更准确的结果，同时本文提出的尺度金字塔模块可以有效地增加网络对尺度变化的鲁棒性。
　　现有的基于密度图的方法过分关注了个体定位，然而在人群高度密集的场景下，每个人头仅占用了极少的像素，强制网络准确定位个体是不合理的。针对这个问题，本文提出了一种新的标签模式——局部计数图。在局部计数图中，每个像素值代表落入输入图像中对应r×r区域中的人头数量。因此，细节的空间信息被丢弃，这迫使网络更加关注计数而不是人头定位。通过在计数和定位之间求得平衡，局部计数图可以达到更好的效果。进一步地，本文针对局部计数图提出了基于回归和分类的联合优化方式。本文在网络后端设置两个分支，一个用于回归局部计数图，一个用于对各区域进行分类，所属类别即为人数。实验表明，本文提出的局部计数图相比于密度图具有更好的效果，且基于回归和分类的联合优化的方式加快了收敛速度，并得到了更好的人群计数效果。
　　现有的人群计数算法多采用全卷积网络进行密度估计。由于卷积操作的感受野是局部的，全卷积网络在建模全局区域之间的关系时存在本质的限制。然而在人群计数任务中，场景中不同密度的区域之间存在很强的相关性，这可以用来提升人群计数的性能。受图卷积网络启发，本文提出了区域关系感知模块来捕获和利用区域间的关系。该模块利用空间注意力机制自适应的将图像划分成不同的区域，并根据这些区域划分将输入特征图池化为一个特征向量来作为这些区域的原始特征表示。之后该模块构建了一个完全连接的有向图，图中每一个节点代表一类相似的区域，而节点之间的边是可学习的。图卷积网络被用来学习在不同区域之间传递信息，产生具有关系感知的新的区域表示。通过自适应地调整节点之间边的权重，来捕获不同区域之间的关系。最后这些区域表示根据注意力图被扩展成特征图，并与输入特征图融合以进行更准确的预测。实验表明，本文提出的区域关系感知模块可以有效地提升人群计数的精度。

其他文献

浅谈小学语文作文教学（2）

【中图分类号】G623.2 【文献标识码】A 【文章编号】2095-3089（2016）34-0158-02　　1.小学语文作文教学存在的问题　　1.1作文过于模式化　　小学生开始学习写作时通常先是模仿，然后才慢慢过渡到自由写作。如果这一阶段教师不运用合理的方法进行引导，学生作文模式化的问题就会非常严重。当下社会信息交流非常频繁，小学生能够从互联网上找到很多作文模板，虽然互联网上的作文素材可以在很

期刊

山体内部条带状目标遥感探测与反演方法研究

近年来，随着人们对土地的需求日益增长，对地下空间的利用手段和技术也在日益进步，对地下空间的利用已经成为城市化发展的一个重要途径。经济上，地下目标的探测将为地下空间的建设规划提供帮助。军事上，对敌方地下军事目标的遥感探测可以增强我国的国防实力。目前，对地下目标的探测方法已扩展包含多个领域，其中，红外遥感探测手段在理论基础、技术成熟度、探测灵活性、探测成本等方面有着明显优势。因此，本文以红外为主要手段，对山体内部条带状目标的探测和反演方法进行了研究，同时利用高光谱和可见光对地下设施通风口进行了初步探测。

学位

体内条带状地下目标遥感探测反演扰动通风口山体地下空间红外遥感数据探测方法高光谱

复杂动态网络牵制控制优化选点算法研究

近年来复杂网络的研究受到越来越多的学者关注，其中如何合理高效地控制网络达到同步是十分有意义的研究课题。本文研究了基于一般复杂网络动力学模型的无向网络牵制控制。根据牵制控制同步的准则，网络的牵制控制同步取决于网络的耦合强度与Laplacian矩阵的删后矩阵对应的最小特征值。通过合理选择受控节点集从而得到一个较大的删后矩阵的最小特征值，是牵制控制优化选点问题的核心所在。本文推导了删后矩阵的最小特征值的相关数学不等式，并依此提出了相应的三个牵制控制选点算法，适用于无向无权网络。
　　在牵制控制单个节点的研

学位

复杂动态网络牵制控制优化选点最小特征值节点数Laplacian矩阵电阻距离算法受控数学不等式策略控制同步

班主任工作的一点想法

【中图分类号】G625.1 【文献标识码】A 【文章编号】2095-3089（2016）34-0179-02　　批评是中小学教师对学生进行教育的必要手段之一。学生的成长正像树木的生长，在长大长高的同时枝枝杈杈会旁逸斜出，要想让学生笔直地、顺利地长大成材，教师必须做修剪的工作，摘去坏叶，砍去歪枝。对于被修剪的树木来说，摘也好、砍也好，都是要痛的，它会不舒服，会逆反、会反抗。所以，修剪讲究方法，批评要

期刊

基于机器视觉的无人艇环境感知技术研究

近年来，随着世界经济增长与科技水平飞速发展，越来越多国家与地区将发展的眼光聚焦于广阔无垠、资源丰富的海洋。为了在资源开发与海洋国防等领域占据先机，世界各国纷纷大力开展海洋装备的研发工作，水面无人艇USV(Unmanned Surface Vehicles)便是先进海洋装备的组成部分。实际上，无论是军用领域还是民用领域，水面无人艇都有着极其重要的价值。加快无人艇相关技术的研究对我国提升海洋装备水平有着极其重大的战略意义。
　　本文依托华中科技大学研发的“huster-68”无人艇以及其配套科研平台，重

学位

机器视觉水面无人艇环境检测识别面目标目标跟踪算法识别模型相关滤波图像增强算法目标检测低对比度海洋

基于单目RGB图像的三维人手姿态估计

三维人手姿态估计是人机交互领域的一个热门研究方向，主要研究如何从图像中估计人手三维姿态，在增强现实和虚拟现实技术中具有重大意义。根据图像形式的不同，该方向包含基于单目、多目和深度图像的估计任务。本文主要研究基于单目RGB图像的三维人手姿态估计方法，估计结果使用人手关键点的三维坐标表示。
　　首先，本文研究基于两阶段深度网络的估计方法。该方法分为两个阶段，第一阶段从图像中估计二维人手关键点的热度图，本文设计了一个新颖的编码解码网络实现逐像素估计。第二阶段从关键点热度图估计三维坐标，借鉴现有方法，本文将

学位

单目RGB图像三维坐标估计方法深度网络姿态估计关键点骨架结构设计二维和三维端到端

基于深度学习的小目标检测算法研究及应用

目标检测技术越来越广泛应用于精确制导，医学图像诊断，自动驾驶，图像搜索引擎等领域。在目标检测的研究中，小目标检测一直是重点和难点问题；在实际应用中，需要在嵌入式环境计算资源有限的情况下，同时满足精度和速度要求，因此，在检测任务中降低计算复杂性和提高计算效率具有重要意义。本文重点研究了快速有效的小目标检测算法和单阶段检测网络的训练方法优化，研究内容如下：
　　针对小目标在深度卷积网络中的特征信息容易被干扰和丢失问题，同时为了保证检测算法的检测速度，本文在Darknet框架下，提出了基于YOLO的小目标

学位

深度学习小目标检测算法研究检测网络训练过程特征图训练方法目标区域目标检测算法分类损失问题特征信息

经皮无线供能与反向数据传输技术研究

具有无线能量传输(Wireless Power Transfer，WPT)功能的微型植入式电子装置是现代医疗设备研发的热点和难点。应用WPT技术不仅可以简化医学装置的外科植入过程，而且可以避免体内电池由于电量耗尽产生的二次手术替换。同时体内植入装置与外部设备之间还需要通过数据交换实现健康监测和控制，因此经皮无线通信技术也备受关注。
　　为解决自由活动生物体内植入装置的经皮无线稳定供能问题，本文对产生均匀磁场的能量发射端进行优化设计。通过对平面螺旋结构发射线圈轴向磁场分布的分析，以线圈轴向磁场分布的变

学位

经皮无线供能平面螺旋线圈数据接收线能量体内轴向磁场植入装置接收线圈发射线圈体外双螺旋结构

中职学校班主任管理工作探究

【摘要】一个班集体的集体力量要得到最大限度的发挥，离不开一个好的班级管理者。中职学校的班主任管理工作更是繁琐，需要倾注更多的心血和耐心。在具体对待班级管理工作时，班主任要立足班级学生实际，抓住群体特点，尽量创造民主、和谐的班级氛围，为社会培养出一批合格的中等专业技术人才。　　【关键词】中职班主任关爱管理自信心　　【中图分类号】G717 【文献标识码】A 【文章编号】2095-3089（20

期刊

面向图像匹配的局部特征提取方法研究

图像局部特征广泛应用于图像匹配、三维重建、图像拼接、图像检索等多个领域中。在这些计算机视觉任务中，图像局部特征的优劣会直接决定模型最终的性能。在实际场景中，图像成像条件复杂多变，比如光照、视角、模糊、噪声等，造成对应同一场景或目标的图像千变万化。因此在多变的图像中寻找不变的图像局部特征表达是一个研究难点。此外，自然场景中还存在很多视觉内容相似的场景或目标，在这些相似中寻找不同的局部特征表达也是一个研究难点。综上所述，在各种场景和成像条件干扰下，研究有效的图像局部特征表达具有重要意义。本文重点研究了面向匹配

学位

图像匹配局部特征提取图像局部特征损失函数样本挖掘特征描述子特征表达联合学习自然场景模型数据集挖掘算法

基于深度学习的人群计数算法研究

与本文相关的学术论文