基于YOLOv3模型压缩的车辆和行人检测算法研究

来源 :大连理工大学 | 被引量 : 4次 | 上传用户:dxseu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,智能汽车获得了极快的发展,环境感知技术是智能汽车周围运动目标行为预测、决策与控制的基础,在很大程度上决定了汽车的智能化水平。车辆和行人是道路交通中主要的参与者和运动目标,基于深度学习的车辆和行人目标检测技术能够有效提高目标检测的精度,进而提高汽车的智能化水平,减少交通事故和人员伤亡。但基于YOLOv3的目标检测算法由于其网络模型规模较大、计算量大、运行所需时间长,难以满足嵌入式平台实时性的要求,需要使用模型压缩来减少网络的计算量,提高网络运行速度。本文研究目的在于提高车辆和行人目标检测算法的准确率和运行速度,最终车辆和行人检测算法运行的速度指标能够在英伟达嵌入式平台Jetson TX2上进行测试。首先基于BDD100K数据集筛选所需的车辆和行人目标,使用K-means++算法替代K-means算法聚类锚框,将锚框在数据集上的平均交并比提高了2.34%。基于筛选的数据集训练车辆和行人目标检测算法实现对车辆和行人的检测,根据平均准确度及实际检测结果分析模型效果。针对数据集中前景目标数量不平衡导致的行人目标的漏检现象,改进损失函数中分类损失和回归损失对于各个类别的回传比例,将行人的准确率提高了7.69%,减少对行人的漏检现象。其次,针对模型的计算量大和运行时间长的问题,在实现基于批归一化(Batch Normalization,BN)层稀疏化的通道剪枝基础上,利用全局通道剪枝阈值与L1范数结合的算法实现对车辆和行人目标检测模型骨干网络中直连(Shortcut)模块的层剪枝,减少模型层间输入和输出的时间消耗。剪掉84%的通道和15个Shortcut模块的轻量级模型,相对于通道剪枝84%的模型大小降低了32%、计算量减少17%、网络推理时间降低21ms,速度为通道剪枝84%模型的1.48倍。最后,基于TensorRT进行网络层融合,并使用半精度浮点数进行推理来提高推理速度。剪掉84%的通道和15个Shortcut模块的轻量级模型使用TensorRT优化后相对于Pytorch版本,运行速度提高30%,网络推理时间和后处理时间相加为41 ms,能够达到实时要求,模型的精度基本保持不变。综上所述,本文对车辆和行人目标检测模型的精度和速度进行了优化,减少了前景目标不平衡造成的漏检现象,最终在Jetson TX2上模型的推理时间与后处理时间满足实时性要求。
其他文献
摘 要:随着工业化的不断发展,我国的水质问题越来越严重。在此情形下,如何解决水质污染问题,已经成为国家重点关注的问题。为了解决这一问题,国家要求各企业安装在线水质分析仪器,通过对各企业水质的实时监控,降低企业对水资源的污染程序。  关键词:在线水质分析仪器;应用;发展趋势  我国的水资源丰富,但是淡水资源不够充足,有部分地方出现缺水、水资源严重污染的情况。水资源被污染,主要是因为企业的排水不达标,
密集部署的小小区、毫米波和大规模多输入多输出天线是实现5G的关键技术。5G将高度异构化,提供全面的高速率覆盖和无缝连接的用户体验。低功率基站可以灵活部署在小区边缘或者热点区域来提高用户的通信质量和频谱利用率。如何减少层内用户间干扰和跨层基站间干扰是异构网络目前研究的重点之一。本文使用增强型干扰协调(enhanced inter-cell interference coordination,eICI
当前高中语文教学紧紧围绕高考这根指挥棒,致使高中语文课堂变为知识灌输、技巧讲解的阵地,丧失了其人文性的学科特点。情感教育的缺失严重影响了学生身心健康的发展,使他们
为了评价转染血管紧张素Ⅱ1型受体反义核苷酸对血管外膜成纤维细胞血管紧张素Ⅱ受体亚型mRNA表达,及细胞内核酸蛋白质的合成水平的作用.采用逆转录-聚合酶链反应克隆血管紧张
近年来,广州市在加快小城镇建设步伐,加大村镇基础设施建设的投入,调整撤并建制镇,重点抓好中心镇建设的同时,积极探索"城中村"改制改造的路子,将"城中村"纳入城市管理体制,