基于区域卷积神经网络的目标检测与识别算法

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:tryst8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习应用到计算机视觉领域,图像处理方法得到了突破性的发展,而目标检测识别作为其中的基本任务,目前在视频监控、人脸识别、目标追踪等方面都有广泛应用。因此,提高目标检测与识别的精度也成了一大热点研究课题。本文着眼于基于深度学习的目标检测与识别算法,对其原理和应用进行深入研究。基于深度学习的目标检测与识别算法大致分为两类:一是基于区域卷积神经网络的算法;二是基于回归的算法。本文主要研究基于区域卷积神经网络(R-CNN系列)的目标检测与识别算法,这类算法首先生成候选区域,然后用卷积神经网络提取特征,最后通过分类器和回归器对检测框进行分类和定位。其中,Faster R-CNN是R-CNN经过多次改进后提出的算法,它是目前精度最高的目标检测识别算法之一,但仍然有比较大的提升空间。本文对这系列算法进行了测试,深入研究Faster R-CNN算法的原理和算法框架,从而分析其优势和不足,并做出改进。本文主要对Faster R-CNN算法进行了两点改进。第一是改进了非极大值抑制算法。非极大值抑制是几乎所有目标检测算法都会用到的一种筛选检测框的方法。传统的非极大值抑制算法是将分类得分最高的检测框作为基准框,然后删除与它IoU大于一定值的框,这种算法能有效去掉重叠的冗余框,但是它的缺点在于不能够很好的处理两个框相邻的情况,如果图片中包含两个相邻或是重叠度很高的目标物体,使用传统的非极大值抑制处理很容易造成误删正确的检测框并导致漏检的情况。本文以减少漏检为目的,对传统的非极大值抑制算法进行了改进,改进后的非极大值抑制不直接删除与基准框重叠度高的检测框,而是逐轮降低它的得分,这样处理使得改进的非极大值抑制不再像原算法那么粗糙,对框的筛选也更加合理。第二点是提出了一种新的多任务损失函数。目标检测与识别的任务分为分类和定位,所以Faster R-CNN的损失函数分为分类损失和回归损失,其中存在一个超参数使得这两部分损失的权重大致相同。本文分析发现,大尺度目标和小尺度目标对于分类和回归的敏感度并不相同,以此为依据我们提出了一种多参数损失函数。它的目的在于使得在检测大目标时,回归损失所占的权重更大;检测小目标时,则更侧重分类损失。从而提高检测小目标的精度及算法整体精度。本文在公开数据集上进行实验,并与目前主流的目标检测识别算法进行对比来验证算法的有效性。实验结果表明,本文对非极大值抑制算法和损失函数的改进和原算法相比提高了准确率,与主流目标检测识别算法相比也有优势。
其他文献
第一次国民经济调整时期既涉及经济、政治、文化教育等各个领域的调整,又涉及中苏论战、社教运动,酝酿发动"文化大革命"等诸多问题,是一段非常复杂且较难客观准确评说的历史
会议
我国刑事诉讼管辖制度未以法定法官原则为指导,故存在不少缺陷:指定管辖的启动标准不明确,被指定管辖法院的具体标准也存在疑问,实践中存在侦查管辖和起诉管辖对审判管辖的预
真空开关以真空作为绝缘介质,具有触头开距小、动作快、燃弧时间短等特点。真空灭弧室作为真空开关的关键组成部分,其设计会影响真空电弧的形态演变。对电弧形态进行诊断,可
半乳糖脂主要包括单半乳糖甘油二脂(Monogalactosyldiacylglycerol,MGDG)和双半乳糖甘油二脂(Digalactosyldiacylglycerol,DGDG))两种类型。已有大量研究指出半乳糖脂不仅参与叶
随着化学农药及抗生素滥用的情况越来越严重,环境污染及人体健康状况受到了极大的威胁,同时菌株的耐药性不断增强,对农牧业的发展造成了不良影响。因此,开发环境友好型农药及
本文围绕社区营造的话题,探讨了什么是社区营造、社区营造实践、中关村社区营造、乡村未来等内容。
自碳纳米材料被发现以来,随着实验技术和理论计算方法的发展,纳米材料的研究也在不断深入。目前,纳米平面结构和纳米团簇的研究成为纳米科技领域的研究热点。由于硼原子的特
作物病害叶片图像分割是基于图像分析和计算机视觉的作物病害识别方法研究中的难题,是从原始病害叶片图像中提取出显著的感兴趣病斑区域,剔除非显著的不重要区域,突出病斑图
随着我国改革开放的深入,逐渐实现从计划经济到市场经济的转变,经济区域化格局日益明显。与此同时,滞后的政治体制改革对逐渐兴起的城市群经济版图形成制约。本文从政府治理
高固气比悬浮换热和反应理论由动力学理论、热力学理论、单元机理和环境协调理论等组成,主要有:——气固两相瞬间换热理论——全窑系统最佳匹配理论——高固气比热交换理论——