基于改进区域建议网络的目标检测算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zgjcq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标检测是使用计算机从静态图像或动态视频中寻找和定位感兴趣目标,并给出其所属类别。目标检测是计算机视觉的基本问题之一,有较高的研究价值和广阔的应用场景,也是当前的研究热点之一。目前的方法在检测精度以及检测效率上尚无法完全达到通用的检测任务的需求,也即目标检测仍是重要且极具挑战的研究课题。近年来,基于深层卷积神经网络的方法提升了视觉特征提取质量,端到端的卷积网络极大提升了特征提取的效率和性能,在目标检测中得到了广泛应用。这些方法大致可以分为两类,一类是将目标定位和分类作为两个子任务分别使用不同的分支网络来完成;另一类则使用端到端的网络来同时完成两个任务。本文在第一类方法的基础上对其进行改进,提升了多尺度条件下的目标检测精度。使用深度卷积神经网络的目标检测算法的精度在很大程度上依赖于图像特征提取的质量。已有的特征提取方法大多只考虑单一尺度的目标,在多尺度特别是小尺度目标特征提取上存在不足。本文借助空洞卷积在构建具有多尺度感受野的顶层特征图。根据数据集中目标的尺度范围,设置多种空洞率,使得特征提取网络可以得到多尺度的特征图。这样区域建议网络分支和目标分类网络分支可以利用多尺度感受野的特征图来更好地处理不同尺度的感兴趣目标,提升区域建议的准确率以及目标分类的精度。另外,由于高层特征图具有高级的语义特征以及更大的感受野,因此利用其产生目标候选框容易忽略小尺度目标。本文在中间卷积层上增加一个新的区域建议网络分支,利用该分支产生更多小尺度的目标候选框。由于中间卷积层具有更小的感受野,同时保留了更多图像细节特征,因此在中间层的特征图像产生小目标的候选框更加合适。本文通过使用两个区域建议网络分支分别在不同感受野的特征图上产生对应不同尺度的目标候选框,从而保证了候选目标框的召回率。由于图像特征是共享的,因此本文提出的目标检测方法可以在保证算法高效性的前提下提升检测的精度。本文工作表明了多尺度感受野特征图对提升检测精度的有效性,同时验证了用于目标定位的区域建议网络在目标检测网络中具有非常重要的作用,其性能对目标分类结果也有一定的影响。本文提出的方法可以在不显著增加计算复杂度的前提下,有效提升目标定位的准确性,从而提升整个目标检测网络的性能。
其他文献
碳氢键的官能化反应实现了碳氢键的直接转化,相较于传统方法更加精简、高效,是现今有机合成化学的热点。其中,广泛研究了过渡金属参与的碳氢键活化反应,而无过渡金属参与的碳
利用视觉信息恢复场景是计算机视觉领域的重要研究课题之一,也在自动驾驶、智能机器人等领域得到了应用。其中利用双目立体视觉技术,获得深度信息,是自动驾驶、智能机器人环境感知的重要手段。获取深度信息的精度和可靠性取决于的关键在于立体匹配算法的效率,为此,开展了着力于提高立体匹配算法精度的研究,并搭建基于SoC的双目视觉系统。本文首先研究了双目视觉相机模型,离线对摄像机进行标定,获得摄像机的内外参数。基于
解析几何高考的七大主干知识,在各个省市的高考中都占有很重要的地位,它是用代数的方法去研究几何问题,不可避免地会涉及联立方程并且求解方程,如何简化运算快速求解就显得极
根瘤菌与豆科植物的共生固氮作用不仅具有巨大的经济和生态效益,在农业生产中,通过人工接种根瘤菌来促进植物生长和提高子实和营养体产量也成为一种常见的农业措施。种子及植
有一种感动叫作"感同身受",所歌颂的是无数渺小汇聚而成的伟大;有一种感动叫作"激情澎湃",所歌颂的是许许多多在这新中国成立70年来奋斗过、拼搏过的人。正是因为他们,我们的
期刊
目的糖尿病酮症酸中毒(DKA)和急性胰腺炎(AP)均为临床急重症,临床表现上有相互重叠之处,易漏诊或误诊。探讨DKA患者并发AP的临床特点。方法回顾性分析2012年8月至2018年10月
1956年黄岩沙埠青瓷窑址群的发现,突破了陶瓷学界对“台州无瓷”的传统认识。沙埠窑的器物在造型、装饰、纹样等方面,特征鲜明,但因未得考古发掘,学界少有涉足而鲜为人知。
《漫水》成功之处是多方面的:张扬乡村伦理,展现地域文化,还有那些淳朴乡土人物的型塑,以及有意而为的舒缓叙事节奏。回到熟稔的乡村,王跃文以一种全所未有的姿态向人们讲述“乡村
南京的石化产业作为南京四大支柱产业的排头兵。在南京经济发展过程中具有举足轻重的作用.而且在国内的石化产业中的地位也仅次于上海。本文主要介绍了蔓圆哈佛大学迈克尔.波特