基于改进SSD网络的低空无人机目标检测研究

来源 :中国科学院大学(中国科学院国家空间科学中心) | 被引量 : 1次 | 上传用户:sxuuboo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以深度学习为代表的人工智能技术的迅速发展,赋能各个行业、拓宽行业边界已经是人工智能技术发展的趋势。其中,安防行业与深度学习技术,尤其是计算机视觉的结合,受到越来越广泛的关注。目前,由于小型无人机的广泛普及,无人机的使用门槛不断降低,对城市安防提出了新的挑战。因此,检测基于光学图像的低空无人机目标,成为一个值得研究的实际问题。目前,在该研究方向,并没有广泛采用的标准无人机目标数据集,同时,对于无人机目标的检测,往往采用传统的目标检测算法,并没有充分利用无人机的特征,在检测精度方面有待提升。除此之外,由于低空场景多变,背景复杂,同时无人机的飞行姿态各异,这些因素都增加了检测的难度,但是也更加适合利用基于深度学习的检测技术。因此,本文以城市低空场景下的无人机为检测目标,开展基于深度学习的低空无人机检测技术的研究,通过实验对比,选择SSD检测网络作为baseline,针对该模型对小目标检测效果较差的问题,本文设计了金字塔特征提取网络,同时利用实际感受野技术,重新设计先验框的尺寸和数量,通过研究低空场景中存在的正负样本不平衡问题,提出了基于Focal Loss的渐进改变难易样本调节因子的算法,并进行视频检测测试。本文的工作主要包括:(1)建立低空无人机目标数据集。鉴于在目前公开的目标检测研究工作中,没有通用、成熟的低空无人机目标图像数据集,研究基于深度学习的无人机目标检测方法存在较大困难,因此本文通过实地拍摄、借鉴现有数据集和技术仿真的方式,建立了一个20000张包含无人机正样本和鸟、风筝等负样本组成的数据集,结合了多种实际场景,并进行目标尺度划分。(2)分析主流的目标检测框架并实验对比。通过对比单阶段和二阶段的检测模型,从实际应用场景出发,选择在检测准确性和检测速度方面表现较好的SSD模型作为改进的基础模型,其对无人机的检测AP(Average Precision)为80.25%,检测速度为0.02s/帧,重点改进小目标检测效果。(3)通过对低层和高层特征图的研究,针对高层特征对小目标特征表达能力弱的问题,引入VGG16低层特征图Conv3_3,对高层特征图进行上采样,并与上一层特征图和其1×1卷积后的输出特征图相加,构建特征金字塔网络,增强了网络对小目标无人机的特征提取能力。接着,通过研究卷积特征图中理论感受野、有效感受野和先验框的关系,重新设计了不同尺寸和尺度的先验框,极大改善了无人机、尤其是小目标无人机的检测效果,检测准确率AP提升了9.12%,最后实验分析了各卷积层对不同尺寸无人机检测效果的影响,提高检测网络对不同场景的定制化能力。(4)针对低空场景下无人机检测任务中显著存在的样本不平衡问题,通过研究目前先进的算法,本文提出了基于Focal Loss的渐进改变难易样本调节因子的算法,使得难分样本的权重不会因为训练过程中置信度的提高而降低,在与OHEM、GHM等算法的对比实验中,在没有降低检测速度的前提下,该算法对小目标无人机的检测AP最高,达到了89.98%。通过实验表明,本文设计的基于改进SSD模型的低空无人机检测算法实现了对各尺度无人机的有效检测,检测AP达到92.84%,相比本文的baseline,提高了15.69%,检测速度为0.031s/帧。最后,设计视频检测模块并开发GUI软件,测试真实场景下的视频无人机检测,在本文硬件场景下,满足实时性检测需求。
其他文献
自2014年中国证监会颁布《优先股试点管理办法》以来,我国的优先股试点工作也已经开展了6年了。然而,起源于西方的优先股,在域外已经有着丰富的实践经验,相较而言,优先股制度在我国只能算是蹒跚起步的婴儿,我国在优先股的发行、上市、退出、保护等政策制定方面还不太完善。虽然学界对优先股有无表决权一直存在争议,但是有无表决权并非优先股的本质特征,无表决权股也不能与优先股划等号。从我国的实践经验来看,无表决权
在中国制造2025与纺织工业“十三五”规划的背景下,通过利用传感器技术,嵌入式技术及网络技术对企业纺织生产设备进行改造势在必行。机械包覆纱机是通过旋转机构制作包覆纱的生产设备,其在纺织行业的中扮演着重要角色,但其维护是困扰企业的一个难题。本文分析了机械包覆纱机的生产工艺要求与工作原理,从设备状态未知、维护繁琐的问题出发,结合国内外设备监控技术的发展情况,对监控对象进行选择与分析,在相关技术路线的研
十九大报告指出,要加强生态文明建设,推进绿色发展,着力解决环境问题,改革生态环境监管体制,其中强调“加强固体废弃物和垃圾处置”。医疗废物污染防治是城市公共卫生管理和生态环境建设的重要组成部分。我国2003年出台《医疗废物管理条例》,随后颁行了一系列配套法规,在医疗废物管理中取得一定成效,但仍然存在倒卖和非法处置医疗废物的现象,究其根本,监管不力是主要原因。解决这一问题需要在现有制度基础上完善医疗废
随着我国电信市场的不断改革,以及互联网、大数据等信息技术的快速发展,电信企业的业务也逐渐多元化,随着新兴业务的快速发展,原有的成本管理方法难以有效的进行成本控制,也难以为企业的战略投资、产品定价等投资经营相关活动提供有效的决策。因此,在目前形势下,建立完善有效的成本管理体系是电信企业持续发展的关键。本文首先采用文献研究法梳理了成本管理的相关文献,做出文献综述;之后采用案例研究法,以Y电信公司为例,
MIL-STD-1553B数据总线已经广泛应用于航空航天综合电子系统中,目前国产协议芯片重量体积较大、协议处理方式相对固定,仍需要CPU软件的紧耦合操作。随着航天技术的发展,航天任务对重量、体积和功耗均提出了较为苛刻的要求。因此设计一种具有自治能力、能够灵活调度总线消息且可自由安排消息帧的总线控制器IP核尤为重要。本文正是在深入研究1553B总线协议规范的基础上,围绕OPCODE控制逻辑对core
P2P网络借贷平台,简称P2P,是互联网金融的一种重要形式。P2P作为一个平台连接了两类群体,一类群体需要筹集资金,另一类群体有闲置资金需要投资机会。2008年金融危机后,人们很难从银行申请小额度的信贷贷款,而小微企业也很难得到传统投资者的青睐。这一现况使得借贷市场产生了巨大的小额度信贷需求,而P2P迅速地填补了这一空白。P2P以其低成本、低门槛的特点迅速发展,成为小额信贷和民间借贷的重要渠道。然
近年来,深度神经网络在计算机视觉和自然语言处理等领域的性能不断超越传统算法,成为新的研究热点。虽然深度神经网络拥有强大的性能,但是同时也有计算复杂度高、内存存储需求大的问题,这使得它们难以应用在计算资源有限的嵌入式设备上。现代深度神经网络中往往都有很高的冗余度,如何有效的降低网络的冗余提升计算效率是一个十分有意义的问题。针对这个问题,研究人员提出了许多神经网络压缩与加速算法,深度神经网络二值化是其
超材料是具有独特和奇异物理特性的人工电磁介质,在传感、成像和能量获取等方面具有重要意义。双曲型超材料依赖于不定介电常数,它具有特殊的高各向异性介电特性。空气-超材料-空气的波导结构能够产生慢光效应,为光吸收、信号处理等方面提供必要需求。制备具有多孔超材料的方法仍然有限的,因此研究具有形状各向异性几何结构的胶体结构的简便方法,可以为制备潜在的双曲超材料提供解决方案;同时现有多孔双曲超材料波导结构的物
改革开放以来,国民经济发展速度显著提高,居民消费能力不断加强,消费已成为推动经济增长的主要动力。农村消费市场以其规模庞大、潜力巨大的特点备受关注,但由于社会及历史等原因,消费水平低、消费供给不平衡、市场发展不足、权益受侵等问题普遍存在,农村消费者权益保护问题不容忽视。中国共产党第十九次全国代表大会上,习近平总书记首次提出实施乡村振兴战略,通过建立健全城乡融合发展体制机制和政策体系,进一步推进农村经
随着无人自动驾驶、AR/VR等技术的发展,视觉SLAM技术已然成为热门的前沿技术之一。传统的视觉SLAM解决方案存在着一些不足,比如单目视觉SLAM无法测量深度、双目视觉SLAM计算复杂、深度视觉SLAM适用性不强等诸多问题。为了解决这些解决方案的局限性,众多解决方法之一就是将多传感器进行融合计算,从而完成系统的位姿估计。本文设计的基于视觉/IMU融合的解决方案借鉴于VINS开源框架,实现了在特定