基于多尺度扩张卷积神经网络的人群计数研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:cjl11082009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市人口的显著增长,人们物质生活水平不断提高,各类大型人群集聚活动不断增多,极易导致踩踏安全事故。对人群场景的智能实时监控引起了重点关注,通过对实时监控视频自动化识别和分析人群密度,及时作出防范措施,对保障社会公共安全有重要意义,也对城市规划、公安侦查、交通监管等领域有重大作用。近年来人群计数算法已成为国内外计算机视觉领域的研究热点,但由于人群场景不一、严重遮挡、背景混淆、透视效应等问题,给研究带来了极大挑战。传统的人群计数算法通常采用基于检测或回归的算法实现,往往只适用于低密度人群场景。人工智能和卷积神经网络等技术的出现,给人群计数问题带来了新转机,但多数已有算法仍只适用于特定场景,难以适应尺度的变化。本文设计了一个多尺度扩张卷积神经网络(multi-scale dilated convolutional neural network,MSD-CNN)用于人群计数,所作的主要创新总结如下:1、采用了密度相关的几何自适应高斯核。因几何自适应高斯核在稀疏人群场景下容易造成较大误差,本文结合场景中人群密度等级来选取不同的β值,从而调整人头尺寸大小以适应不同密度的人群场景,生成更加真实的参照密度图。2、在单列的网络结构中设计了一个多尺度特征融合模块。因多列或者多输入的网络结构存在设计复杂、计算量大的缺点,为了降低网络复杂度的同时适应图像中人物尺度变化,MSD-CNN采用单列的网络结构进行特征提取,并参照Inception模块和VGG网络思想,设计了一个多尺度特征融合模块来聚合不同尺寸的人群特征。3、引入扩张卷积来代替池化过程。因池化层会降低图像分辨率、丢失重要细节特征,MSD-CNN用不同扩张系数的扩张卷积层来替代池化层,在增大感受野的同时保持图像分辨率,防止小尺度特征丢失,提升密集人群场景下的计数准确率。本文在两个极具代表性的公开人群数据集上对MSD-CNN进行了验证,实验结果表明本文提出的MSD-CNN人群计数模型在降低网络复杂度的同时,对不同的人群场景有较好的适应性,可以比较准确地估计人群密度分布和人群总数。与几个主流的人群计数算法相比,本文的方法准确率更高、鲁棒性更好。
其他文献
产能过剩严重阻碍和制约着我国经济健康的发展,制造业成为产能过剩的重灾区,其中重工业更为严重,这主要是因为重工业大多都是资本密集型行业,实际生产过程需要大量的投资从而
非晶合金作为一种亚稳态材料,由于其微观结构的“无缺陷”—内部没有位错、晶界、相界,不存在偏析、夹杂等缺陷,所以具有比晶态金属更加致密的无序堆积状态,因此大块金属玻璃
传输泵站是煤矿供排水系统的重要组成部分。该设备的稳定、可靠运行为矿井的安全生产提供有力的保证。但其存在能耗、成本、安全、设备监测监控、劳动生产率等方面的问题,为
随着互联网的飞速发展,涉及网络和数据的服务与应用呈现爆发式增长,与此同时越来越多的网络安全风险和问题不断暴露出来。计算机病毒自我复制和传播能力强、破坏力大,从而引
毫米波技术和大规模多输入多输出系统(Massive MIMO)的集成可以增加可用带宽并且提高频谱效率,被认为是未来无线通信系统最有前景的技术之一。但是,由于毫米波频段射频链路功
双相不锈钢因兼具奥氏体铁素体两相组织特点,作为一种高性能结构材料被广泛应用于石化、化工、海水和造纸等工业领域。节Ni型双相不锈钢通过以Mn代Ni来稳定奥氏体相,由于Mn和
相对输出图像,输入图像有时来自单一传感器,或者不同传感器,通过融合技术可以将多幅输入图像组合为单幅输出图像,让其包含的场景信息优于任意一幅输入图像。近三十年来,图像
以水淬镍渣为代表的含铁、硅系废渣年排放量达1000万吨以上,然而我国镍渣的利用率较低、大量堆积在渣场,既造成资源浪费又污染环境。目前国内外的主要研究重点是火法回收其中
行人检测旨在检测出图片或视频序列中是否存在行人并对其定位,通常用于智能监控、智能机器人以及自动驾驶领域中。作为众多任务的重要前置处理环节,它常常与行人跟踪、行人重
随着数据时代和信息时代的到来。信息和数据越来越成为社会经济发展和人们生活提高的重要推动力。而检索作为高效获取信息方法就显得尤为重要。跨模态检索作为获取跨模态信息