基于深度学习的多尺度目标检测优化算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:gpm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉领域作为一个新兴技术正在不断发展与进步,其中目标检测任务是计算机视觉中十分基础同时又特别重要的一个研究领域,在监视与跟踪、医学影像分析、机器人导航、国防系统(目标自动识别)等多个领域有着必不可少的作用。目标检测的任务就是在所给定的图片中找出目标的具体位置,同时在目标上标记出其属于哪一种类。尽管随着深度学习的发展不断涌现出新的算法,但对于通用目标检测领域来说还具有很大的挑战。本文详细地阐述了基于深度学习下目标检测算法原理,并对一阶段的目标检测算法做具体分析,提出优化和改进。主要内容如下:(1)介绍了传统的检测算法和在深度学习技术发展下的目标检测算法。将目前主流的目标检测算法做归纳与总结,对卷积神经网络的各个模块的原理做出系统的讲述,深入研究了基于候选区域的两阶段目标检测算法和基于回归的一阶段目标检测算法。(2)提出基于多级特征金字塔网络的改进SSD目标检测算法。由于SSD算法在面对目标检测中广泛的尺度变化问题的时候,检测效果不佳,本文提出基于多级特征金字塔网络的改进SSD目标检测算法。改进的算法在原SSD网络结构的基础上,设计了一个交替连接的增强型FPN模块和特征融合模块,从每个增强型FPN模块输出的各个多尺度特征再进行尺度特征聚合,构造出一个多级特征金字塔网络完成最终的检测。实验表明,改进的算法对各个尺度的检测精度均有所提高,尤其是对小目标的检测,效果明显。(3)提出一种改进型YOLOv3目标检测算法。尽管YOLOv3算法在目标检测方面速度很快,但由于检测任务中复杂的环境与背景,往往存在边界框的定位不够准确、对小目标的检测精度不高等问题,本文以YOLOv3算法为基础,提出一种改进的YOLOv3目标检测算法。首先将主干网络融合跨阶段局部网络CSPNet来增强网络的特征学习能力;然后引入一种改进的空间金字塔池化结构来增强特征提取能力,充分利用网络的多尺度局部区域特征;最后在损失函数中融入focal loss来针对正负样本不均衡所带来的问题。实验表明,改进的YOLOv3算法在检测性能上优于原算法。
其他文献
伴随着机器人技术的快速发展,移动机器人在日常生活和工厂工作的身影越来越频繁。论文针对生活、工业上的移动机器人可以自主运动,完成特定任务,如监控环境、搬运小物件等,所提出的全向移动机器人的研究。分析麦克纳姆轮的的运动学方程及其全向运动车轮的转向关系、对移动机器人同时定位和创建地图(SLAM)以及路径导航规划展开研究,以ROS作为软件基础设计了自主导航系统,同时搭建了四轮全向移动机器人样机,验证自主构
求解最优化问题一直都是计算机工程、生产调度、人工智能等领域广泛关注的一个问题,其核心思想是在可行解范围内设计符合特定约束条件的方案,使得目标最优化。随着计算机科学技术的飞速发展,经典的传统优化方法已不足以解决约束条件越加复杂的优化问题。群智能优化算法普遍具有灵活度高、寻优性能良好、鲁棒性强等优势,该类算法可以更好的解决非线性、大规模的复杂优化问题,因此自其提出之日起便受到广泛的关注与研究。近年来,
伴随着互联网技术的迅速发展,网络的安全问题越来越引起人们的关注。在复杂网络中,存在着大量的攻击性病毒,一旦网络中的计算机被病毒感染并爆发,将会对人类的生产生活造成不可估量的损失。因此,本文针对网络安全中存在的问题,研究了恶意代码的分类和病毒的传播控制方法。通过从不同的角度来遏制或减小病毒在计算机中的传播,从而控制其造成的不良影响。本文主要进行两方面工作:(1)针对恶意代码家族存在的混淆问题,提出了
随着双目立体视觉理论的发展,以及计算机硬件计算能力与影像采集设备精度的提升,双目立体视觉技术在三维测量、目标定位与三维场景重建等领域应用愈加广泛。在环境复杂的井下矿山中,实现准确、稳定的出矿计量,是当前矿山企业在生产管理中必须考虑的现实问题。针对矿斗载矿量测量的问题,本文以形状不规则的钨矿石为研究对象,提出了一种基于双目立体视觉的非接触式体积测量方法,并对形状不规则的矿石进行了体积测量试验。双目视
影响最大化问题旨在从社交网络中找出能使信息扩散范围最广的Top-k个用户作为信息源发散信息。社交网络结构的多样化不断给影响最大化问题注入活力,让它在近二十年里经久不衰,一直是学术界的热门问题。本文从基于割点的社交网络影响最大化算法和通过优化网络结构实现影响最大化两个方面展开如下工作:(1)基于割点的社交网络影响最大化算法:现有算法主要关注于节点的特征,较少从社交网络的连通性角度来看待影响最大化问题
本文的研究基于现实安检过程中,管制物品图像的语义分割来展开。目前,管制物品的检测工作大部分是通过安检X光机对包裹扫描,人眼判断包裹是否夹带管制物品,其中,安检X光机对包裹中的一些小目标检测效果较差,甚至检测不到,存在安全隐患,管制物品的自动语义分割能有效提高安检效率和提升安全指数,并同时能够节约人力成本,保障人们在公共出行和公共场所的安全。图像的语义分割是计算机视觉基本任务之一,图像的语义信息是用
水下机器人由于具有携带方便,操作简单的特点,被广泛应用于水下资源勘探与开采,因此,对其控制系统的研究,实现水下机器人稳定、快速、准确的运动控制,具有重要的工程意义。针对水下机器人受水流影响大,受力情况复杂,难以实现高效的运动控制等问题,本文采用串级LADRC控制方法对水下机器人的艏向与深度进行控制;利用粒子群算法对串级LADRC控制器的参数进行优化,具体研究如下:首先,利用solidworks建立
语音增强在数字信号处理领域占据着举足轻重的地位,能在改善受损语音质量的同时提升其可懂度,在智慧家庭等方向得到了广泛地应用。随着深度学习在计算机领域的普及,基于深度学习的网络模型训练成为了当下实现语音增强的主流方法。目前主要是基于深度学习来搭建网络模型,并结合大量数据运算,在模型中学习从带噪特征映射到增强目标的函数,以解决语音增强任务。然而,该方案仍然存在着语音增强质量不高、模型训练速度缓慢以及模型
磁悬浮列车具有零摩擦、少运维、爬坡能力强、智能化程度高等特点。进一步提高我国自主知识产权的磁悬浮相关技术,是促进磁悬浮技术推广应用、加快交通强国建设、构建现代化高品质综合立体运输网络的重要战略抓手,具有重大战略意义。本文针对磁悬浮列车速度跟踪控制算法设计中存在的问题,开展如下研究工作:(1)通过数据拟合的方法修正磁悬浮列车牵引特性曲线,并梳理总结、优化完善磁悬浮列车动力学模型、阻力模型和牵引计算模
随着无人驾驶技术和智能交通领域的发展,目标检测已经成为机器学习中最典型的问题,其中行人检测作为智能交通领域中重要的组成环节,因此也成为目前国内外研究者重点研究的课题之一。本论文主要针对道路交通场景下的行人检测问题进行研究,由于复杂的背景和不可控的自然条件会为我们的检测任务带来挑战,通常情况下主要表现为:一方面图像中的行人尺度和姿态不一,同时受到外界光照和天气环境等不可控自然条件的影响使得一些行人变