【摘 要】
:
人工智能已经在大数据分析、计算机视觉、语义分析等各个领域做出了重大突破,卷积神经网络(Convolutional Neural Network,CNN)是它的一种研究方法,在计算机视觉领域充当着重要角色。在近些年,卷积神经网络在人群密度估计研究上做出了一次又一次创新突破。受空间透视,遮挡严重,光线变化等问题的影响,人群密度估计在研究上仍然面临一系列挑战。在目前的卷积神经网络研究领域,多特征融和概念
论文部分内容阅读
人工智能已经在大数据分析、计算机视觉、语义分析等各个领域做出了重大突破,卷积神经网络(Convolutional Neural Network,CNN)是它的一种研究方法,在计算机视觉领域充当着重要角色。在近些年,卷积神经网络在人群密度估计研究上做出了一次又一次创新突破。受空间透视,遮挡严重,光线变化等问题的影响,人群密度估计在研究上仍然面临一系列挑战。在目前的卷积神经网络研究领域,多特征融和概念以不同的形式存在着,涉及领域内的方方面面。1.提出了多尺度多通道融合人群密度估计网络。网络框架分为三个部分:特征提取、特征融合、特征回归。为了更加快捷有效的提取特征信息,选用VGG16作为骨干网络;为了获得信息更加丰富的特征图,将骨干网络中相邻两个不同尺寸的特征层进行融合;为了检测出不同大小的目标,在这里使用多通道空洞卷积,获取不同的感受野。通过多层级多通道的信息融合,网络框架接受信息的能力得到增强,同时在多个数据集中的实验,验证了此网络的有效性,缓解了检测中大小目标难以同时检测的问题。2.提出了基于注意力机制的人群密度估计网络。网络框架分为两个部分,第一部分选用CSRNet的编码译码结构以获取特征信息并进行密度图回归,第二部分使用注意力特征融合模块获得密度等级图以减少背景对预测结果的干扰,注意力模块以编码部分不同层次的特征图作为输入,进行局部注意力与全局注意力的高聚合注意力感知。为了缓解背景区域对最终预测结果造成干扰的问题,引入了可以将跨层次特征图进行注意力特征融合的模块,在不同层次的特征图上进行融合然后分割前景背景区域,获得感知能力更强的注意力聚合机制。通过在多个数据集中的实验,证明,此网络框架对背景的抗性,同时提高了预测的准确率。3.总结前两种方法的特点,将两种方法结合起来,提出了基于多级融合下注意力机制的人群密度估计方法。为了能够将之前提到的问题同时克服,将之前使用的基于多尺度多通道融合的人群密度估计方法和基于注意力机制的人群密度估计方法相结合,将注意力特征融合模块输出的密度等级图与多通道模块输出的密度图相乘,获取更多信息的同时减弱背景干扰,获得更加精准的密度图。为了验证模型的性能,本文末尾提供了Shanghai Tech数据集、UCF_CC_50数据集的测试结果。研究结果表明,本文的网络框架回归的密度图精准度更高,得到的人群密度估计结果更加准确,具有更加优越的鲁棒性。
其他文献
随着互联网的迅猛发展,数据量出现大幅度的增长,用户需要消耗大量的人力物力来管理和存储数据,云存储技术应运而生。用户之间持有相同的数据,云端就不得不存储海量的重复数据,造成数据冗余和云端存储资源的浪费,同时也使得数据传输效率大大降低。重复数据删除技术的出现,在节省存储资源和带宽的同时,也造成了去重效率低下和数据泄露等问题:(1)在重复数据删除的过程中会产生大量的计算机调度冲突问题,如何在保护用户数据
蛋白质翻译后修饰(Post-translational modifications,PTMs)通过对蛋白质的特定氨基酸位点与功能基团进行共价结合来增加蛋白质组的功能多样性。翻译后修饰对大多数的生物过程有着关键性的作用。其中,ADP-核糖化(ADP-ribosylation,ADPr)修饰是将ADP-核糖从烟酰胺腺嘌呤二核苷酸(NAD+)转移到基质蛋白上并释放烟酰胺(Nam)的修饰过程。ADP-核糖
高维数据通常存在于低维子空间中,随着现实世界中数据量变得越来越多,数据类型越来越复杂,通过恢复低维子空间来揭示数据内部结构性信息的技术也变得尤为重要。数据量的增多给予了数据标记工作很大的压力,而聚类作为无监督学习方法则有效的避免了这一难题。随着数据维数越来越大,信息量越来越复杂,传统的聚类算法在聚类分析时效果不理想。在多种聚类算法中,子空间聚类从数据本身的性质出发,利用数据集的低秩性和稀疏性,成功
图形与几何是初中数学教学的重要内容,通过对图形与几何知识的研究和学习,能够使学生提高空间观念、推理能力和几何直观。图形和几何也是中考重点考察范围,是提高学生直观想象核心素养的主要途径。新课标中初中图形与几何教学的内容分为图形的变化、图形的性质、图形与坐标。其中勾股定理作为千古第一定理,且作为八年级第一章的内容出现,在后面的应用中至关重要,是培养学生几何思维水平由分析水平和非形式化演绎水平过渡到形式
中考是初中结业考试,也是高中的升学考试,是对学生基础教育阶段的重要评价,因此,研究中考试题对中考命题和教师教学都具有重要意义.本文研究对象为2016-2020年青岛市中考数学试题,利用比较分析法、文献分析法及统计分析法对试卷进行结构分析,再从核心素养的角度对试题中各类题型进行分析,最后根据喻平的数学核心素养评价框架对试题进行数学核心素养测评,得出以下结论:1.试题重视对核心素养的考查,不同类型的题
具有高反光弧面的金属产品广泛应用于各行各业。由于高反光弧面强镜面反射特性及弧面视角遮挡,基于视觉的表面缺陷检测存在困难。本文针对具有高反光弧面的管材产品,设计基于流水线的表面缺陷检测系统,并提出了多种基于视觉分析的检测方法及比较分析。本文具体研究内容如下:1.首先,分析了高反光弧面对缺陷检测的不利影响,为解决上述对缺陷检测的不利影响,本文分析了基于固定多视角方式设计的高反光弧面缺陷检测系统优缺点,
随着信息共享的推广和普及,数据库作为一种信息存储工具被广泛使用和传播。数据库在传播和共享的同时,也出现了各种数据库侵权及盗版问题。数据库被恶意传播及复制,对原数据库所有者的利益造成了极大的损害。有关学者就相关问题提出了关系数据库水印技术,即通过在数据库中加入一些微小错误来证明数据库版权归属。然而,由于当前大部分数据库水印方案仅通过密钥及水印串进行一次嵌入,在检测时无法控制水印恢复的比例,因此,大部
图像分割技术研究的重点在于分割目标的精度和速度。目前已出现多种边缘提取及区域分割的模型和方法,但很多方法仍然存在着计算效率低、分割精度不高、鲁棒性差等问题,所以分割的精度和速度还是有待研究和改进。Chan-Vese模型是经典的图像分割变分模型,多相图像分割是Chan-Vese模型的成功延伸。本文以Chan-Vese模型为例,提出两种快速迭代求解方法,该算法适用于Chan-Vese模型的图像分割,并
数感在《全日制义务教育数学课程标准(实验稿)》2001版中第一次被明确提出来,2011年我国颁布的《义务教育数学课程标准》中再一次强调了数感的重要性并成为十个核心素养之首。数感是学好数学的基础,因此在数学学习中有着至关重要的作用,通过对学生数感的调查研究,可以帮助老师了解学生数感的现状,更好的指导教育教学,从而促进学生数感的发展和数学水平的提高。本研究针对青岛市A、B、C三所初中进行调查,首先通过
在立体图像质量评价(Stereoscopic Image Quality Assessment,SIQA)领域,如何有效地模拟人类视觉系统(Human Visual System,HVS)对图像质量进行评价是一个重要且具有挑战性的问题。考虑到人眼视觉特性对图像质量评价的影响,本文详细介绍了HVS的基本结构,并且对其产生的视觉感知特性进行了详细分析。为了结合人眼视觉特性,设计出更加符合人眼视觉感知过