航拍视频密集车辆目标检测算法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:protosser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为交通运输业的核心对象,不同类型的车辆对于交通运输的作用和影响不同,而各种车辆的类别、位置分布以及数量等信息对于车流量估算、实时交通运输状况的监测、分析和管控工作有着极为关键的作用,对实现智能交通运输系统更是意义非凡。相比基于车载或路边固定摄像装置的视频中的车辆检测,航拍视频车辆检测借助航拍独特的广阔视角,可以更加方便地获取更加全局的车辆信息。因此,为了实现高精度的实时航拍视频密集车辆检测,本文主要针对基于深度学习的目标检测算法进行研究和改进,提出了基于改进的SSD模型的轻量级航拍视频车辆目标检测算法,并基于该算法设计实现了对应的航拍视频车辆目标检测系统,最后在实验室数据集上通过实验验证了算法和系统的有效性。本文的主要工作和创新点如下:针对航拍视频中的车辆目标尺寸小、数量多而密集、方向不确定以及分辨率不一的特点,提出了基于改进SSD的轻量级航拍车辆检测算法。首先从模型激活函数角度,对Swish进行改进,提出了RH-Swish系列激活函数,降低计算开销的同时,通过引入通道可不共享的可训练参数和随机参数提升激活函数的灵活性,同时也提升了模型的表达力和泛化能力。然后将backbone由VGG16替换为改进的轻量级CNN模型——RHMNet和RHSNet系列,有效规避了原始模型检测实时性差、资源占用高等诸多缺点。接着通过对航拍训练集进行k-means||聚类辅助确定default boxes的尺度和纵横比,同时根据特征图尺寸、等间距尺度设置方法以及检测框数量限制等多方因素确定预测层的位置以及对应的default boxes配置,克服了原始SSD模型中各预测层default boxes尺度和纵横比与目标尺寸不匹配的缺陷。之后对损失函数和总损失的形式进行改进,以缓解正负样本不平衡,难易不平衡和类别不平衡“三大不平衡问题”,同时在检测后处理部分引入了基于改进惩罚函数的双阈值NMS,有效降低虚警,改善漏检。之后,从模型训练和优化的角度,进行大量的数据增强,引入最佳的优化算法,并针对本文提出的新激活函数设计模型初始化方法,提升训练效率和模型精度。并且,引入的多尺度训练方法帮助模型确定最佳的输入尺度,在提升密集小目标检测精度和保证检测实时性之间实现良好折衷,离线困难样本挖掘进一步有效解决了诸多“极难正样本”的漏检和“极难负样本”的虚警问题。从注意力机制和多尺度上下文信息增强两个角度对上一部分提出的算法和模型进行进一步增强:1)在基于注意力机制的模型增强部分,首先从通道注意力和空间注意力两个维度,分别提出了改进的通道注意力单元CAU和空间注意力单元SAU,并将其应用于模型backbone的building blocks和总体结构中,提升backbone的特征提取能力,降低模型冗余,增强模型的表达能力。然后,针对不同的backbone结构,将两种注意力机制通过特定的连接方式进行整合,同时在通道和空间两个维度实现更加精细化的特征增强。2)在基于多尺度上下文信息的模型增强部分,主要从感受野模块和特征融合两个层面展开。首先,对原始的RFB进行改进,提出了轻量级的感受野模块L-RFB系列,并将其用于检测模型的特征提取和检测框生成,一方面向模型引入多尺度的上下文信息,另一方面增大了预测层的感受野。然后基于现有的特征融合方法,从自顶向下和自底向上两个角度分别提出了基于反卷积、基于Reshape的特征融合方法和基于池化的特征融合方法,分别用于解决浅层上下文信息不足和深层细节信息(如位置、边缘等)不足的问题。最后,对本文两个阶段提出的航拍视频车辆检测算法基于深度学习框架进行实现。在实验室数据集上的测试结果显示,相比于原始SSD目标检测算法及其几种轻量化变体,本文所提出的基于改进SSD的轻量级航拍车辆检测算法和模型实现了检测精度与实时性的双重提升,而模型增强算法又进一步提升了模型的检测精度,并且本文提出的增强模型RHSDet的m AP超越了几种主流的精度较高的非轻量级目标检测模型,从而证明了本文检测算法和模型增强算法的有效性和优越性。
其他文献
拉索作为现代大跨度桥梁的关键构件,对环境介质的侵害较为敏感,且防护体系破损情况不易检查,其腐蚀问题是桥梁工程运营维护的关注重点之一。目前对于服役期间拉索健康状态的检测与监测主要集中在拉索的损伤和断丝方面,而对于其早期腐蚀的检测与监测研究较少。由于电阻传感技术在金属腐蚀监测中具有较高的灵敏度,本文以拉索中含锌铝合金镀层的高强钢丝为研究对象,先后进行了基于电阻传感的钢丝腐蚀监测理论分析、相关参数标定试
近年来,随着网络社交平台的迅速发展,社交媒体也随之兴起。社交媒体每天发布海量信息,内容主题涉及各个领域。内容中隐含的情感信息对舆情监测、民意调查等有巨大的利用价值。然而,目前的情感分析技术主要针对通用文本,在社交媒体场景下存在诸多问题:社交媒体内容日益多元化、专业化,致使情感分析模型在没有先验知识支持下难以充分理解社交媒体信息;传统情感分析算法分析粒度较粗,难以深度挖掘网民情感产生的原因;社交媒体
异常检测的基本目标是检测出偏离整体数据特征的稀少数据,近年来随着互联网技术的快速发展和大数据时代的来临,数据增长速度加快,数据多样性增加,异常检测问题得到越来越多的关注,越来越多的应用在网络入侵、信用欺诈、故障检测、医疗诊断、信息安全等领域中,特别是无监督式的异常检测技术,应用场景更广泛、技术难度更大,因此对其进行研究具有重要的意义。本论文首先对异常检测领域相关技术进行了总结,比较了现有的异常检测
LCoS空间光调制器(LCoS SLM)是一种新兴的液晶光学器件,可以对光波的振幅、相位、偏振态等信息进行灵活调控。近些年,随着光电子技术与现代通信技术的发展,LCoS空间光调制器被广泛应用于通信领域中,其中最重要的应用在1550nm近红外段的波长选择开关(WSS)系统中,作为衍射光栅对光波进行调制。利用LCoS空间光调制器的高分辨率特性,结合像素化电信号驱动,实现光波信号在不同波长通道之间的交互
开关电源在高频高功率密度的发展趋势下,解决由快速开关动作引起的EMI超标已经成为无法避免的设计环节,但额外的EMI优化成本往往导致产品竞争力严重下滑。在不影响性能的前提下找到能有效解决EMI问题的低成本方案具有重要的研究与应用价值。反激变换器作为现阶段消费类电子的常用电源拓扑,通常采用添加原副边Y电容形成低阻抗通路来减少EMI噪声,但随之而来的却是泄漏电流的大幅增加。这不仅导致因无法满足国家安全标
我国是地震灾害多发的国家,研发和应用建筑减震技术具有重要的意义。高层建筑中剪力墙是一种重要的结构形式,而竖向接缝连接是其中一个重要研究方向。为提升该类型结构的抗震性能,本文提出在竖向接缝处安装粘弹性阻尼器,旨在通过阻尼器来耗散能量。本文通过采用试验研究与有限元数值模拟相结合的方法,研究粘弹性阻尼器和竖缝设置铅粘弹性阻尼器的装配式剪力墙的抗震性能,主要研究内容和成果如下:(1)以粘弹性层厚度、剪切位
能源是城市发展进步的重要支柱,在城市能源需求日益增长的同时,环境污染、能源供需不平衡的问题不断加剧。因此,对建设具有更高能源利用效率、更多清洁能源接入的城市能源系统的需求愈发迫切。随着智慧能源概念的提出,面向城市范围内能源应用的城市智慧能源系统的建设成为城市能源问题的一种解决方案,其中,体系架构是城市智慧能源系统研究非常重要的部分。由于城市智慧能源系统的研究总体处于起步阶段,对其详细的架构设计极少
验证码作为网络资源保护的第一道防线,用于区分用户是计算机还是人类,它在网络安全中扮演着重要的角色。但是随着各种破解工具的不断发展,当前的验证码系统已难以保证其有效性。尤其是文本验证码和图像验证码这两种应用最为广泛的验证码,在面对深度神经网络模型的识别时,安全性严重降低。对抗样本是指在原始样本上添加人类不易察觉的噪音而构造的样本,它可以欺骗深层神经网络模型,使其产生错误的识别结果。本文研究基于对抗样
随着人工智能、信息物理系统、大数据、云计算等技术日益成熟与广泛应用,其与能源产业的结合,推动了能源产业新技术、新模式和新业态的兴起。能源体系与发展模式产生了巨大变革,智慧能源已成为未来能源产业发展的大势所趋。城市智慧能源系统是智慧城市的重要支撑,全面科学地评价城市智慧能源系统的发展进程,及时发现城市智慧能源系统发展的薄弱环节,对于正确指导城市智慧能源系统的规划与建设具有重要的现实意义。因此,本文针
随着城市轨道交通的不断发展,居民出行越来越偏向于选择地铁出行。对每天数以百万计的客流量进行协调成为城市轨道交通运营管理最难也是最迫切需要解决的问题。城市轨道交通OD客流(Origin-Destination,OD)直观体现了城市轨道交通网络中所有乘客出发点与到达点之间的交通需求。随着城市轨道交通线网规模的迅速扩大和车站站点的激增,带来OD客流矩阵和客流数据的爆炸式增长,传统OD客流预测方法难以适用