基于改进的Mask r-CNN的车辆识别及检测

来源 :安徽大学 | 被引量 : 0次 | 上传用户:hustguoguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车行业的迅速发展,交通事故处理逐渐成为交管部门的一项挑战性工作。为进一步提高交通事故处置效率,在静态图像中对事故车辆完成识别和检测任务是文本研究的主要内容。传统的车辆图像识别算法将特征提取与目标分类常分为两个阶段,特征选取需要人工构建,主要依靠人为经验,整个过程效率低下,特别在现实复杂的交通场景中,由于天气、光照、环境以及光学抖动等因素的影响,不能够有效检测出目标。针对传统车辆检测算法的不足,卷积神经网络的兴起逐渐成为主流的目标检测算法,其主要优势在于目标检测中候选区域生成、特征提取、分类、位置精修四个步骤被统一到一个深度网络框架之内,有效提升了检测效率,并且针对目标旋转、位移具有一定的不变性,可适用于复杂场景。本文研究参考前沿的卷积神经网络知识,并将其应用于静态图像中的事故车辆检测,主要完成以下工作:  1)研究了卷积神经网络在目标检测时的结构及工作原理,并对目前目标检测领域具有代表性的神经网络R-CNN、SSPNet、Fast R-CNN、Faster R-CNN、MaskR-CNN算法分别进行研究,通过对每一种网络结构的研究对比,可直观了解每一种网络的构建原理,进而更清晰认识Mask R-CNN的网络结构在目标检测中的优势。  2)结合事故现场中车辆检测问题,本文在原Mask R-CNN网络模型基础上通过对网络结构及部分细节进行改进,从而更好地适应于实际应用问题,实现该网络的应用价值。由于车辆检测可以近似看成一个二分类问题,所以在特征提取网络结构上通过减少网络层数的方式,剔除在特征提取中产生的冗余特征信息,提高算法运行速度,实验结果证明当网络层数减少8层时,算法达到最佳效果。在设计候选窗口分类器时,为了防止过拟合,本文将dropout层的阈值设置为0.5,同时在候选窗口位置增加了池化层。在候选框生成时,将非极大值抑制算法改进为学习网络,使得模型可以更加灵活选取极大值,摆脱人为经验对于模型的影响,提高模型的泛化能力。  3)结合研究背景,本文首先通过ImageNet以及PASCAL VOC车辆图像对模型进行了初步训练。为了使模型更加适应事故图像中车辆识别和检测问题,本文建立了两类数据集,第一类是事故车辆数据集,第二类是航拍车辆数据集。由于在公开数据集中事故车辆的数据集相对较少,为了扩展数据集,本文采取数据增强的方式进一步提高模型的泛化能力。
其他文献
本文介绍了住宅照明设计现状,讨论了住宅照明设计中光源及灯具选择的要素,并着重对各套内空间的光环境及其电气照明设计进行讨论。 This paper introduces the current situ
信赖域方法和线搜索技术都可以保证非线性优化算法整体收敛,各有优势,信赖域方法能保证算法具有良好的收敛性,线搜索技术在确定新的迭代点时计算量较小.Nocedal和Yuan提出了结合
对于Banach空间几何理论的研究一直是众多研究工作者所关注的焦点点,特别是Banach空间的几何结构和各种几何常数,运用这些不同的几何常数不仅可以研究Banach空间的几何结构,也可以与不动点理论相结合。本文主要研究Banach空间中广义光滑模及其应用。主要从三个方面进行展开。首先,介绍了课题的研究背景,对Banach空间几何理论的发展做出简要介绍,并且简要的展示了本文的主要研究内容。其次,给出
学位
本文利用胡星标等人提出的“源生成法”,在一个可积的全离散Leznov格方程和两个可积的半离散Leznov格方程(由二维Leznov格方程离散化而得)的基础上,分别构造出一个带源的全离散Le
全球气候的变化已成为国际社会普遍关注的热点问题,如何遏制全球环境继续恶化、降低污染物排放量,已经成为世界各国政府以及学者的共识。从2003年开始,我国二氧化硫排放量已居世
本文中在DG代数层面介绍了Keller的Koszul对偶理论,研究了DG代数完备导出范畴中的silting对象以及正分次箭图上的极小的A∞路代数的导出范畴。具体地,得到如下结果。对给定域K
图像分割是高级图像处理如图像理解和图像识别的基础,是图像分析和计算机可视化的重要分支,无论是在理论研究领域还是实际应用领域都具有很高的关注度.另外随着人类活动范围
变量选择是统计推断中的经典和热门研究课题。例如在癌症疾病研究中,真正决定癌症疾病发生的基因只有数十个,从成千上万的基因中选出这具有决定性作用的数十个基因,就是一个变量