论文部分内容阅读
近年来,智能汽车获得了极快的发展,环境感知技术是智能汽车周围运动目标行为预测、决策与控制的基础,在很大程度上决定了汽车的智能化水平。车辆和行人是道路交通中主要的参与者和运动目标,基于深度学习的车辆和行人目标检测技术能够有效提高目标检测的精度,进而提高汽车的智能化水平,减少交通事故和人员伤亡。但基于YOLOv3的目标检测算法由于其网络模型规模较大、计算量大、运行所需时间长,难以满足嵌入式平台实时性的要求,需要使用模型压缩来减少网络的计算量,提高网络运行速度。本文研究目的在于提高车辆和行人目标检测算法的准确率和运行速度,最终车辆和行人检测算法运行的速度指标能够在英伟达嵌入式平台Jetson TX2上进行测试。首先基于BDD100K数据集筛选所需的车辆和行人目标,使用K-means++算法替代K-means算法聚类锚框,将锚框在数据集上的平均交并比提高了2.34%。基于筛选的数据集训练车辆和行人目标检测算法实现对车辆和行人的检测,根据平均准确度及实际检测结果分析模型效果。针对数据集中前景目标数量不平衡导致的行人目标的漏检现象,改进损失函数中分类损失和回归损失对于各个类别的回传比例,将行人的准确率提高了7.69%,减少对行人的漏检现象。其次,针对模型的计算量大和运行时间长的问题,在实现基于批归一化(Batch Normalization,BN)层稀疏化的通道剪枝基础上,利用全局通道剪枝阈值与L1范数结合的算法实现对车辆和行人目标检测模型骨干网络中直连(Shortcut)模块的层剪枝,减少模型层间输入和输出的时间消耗。剪掉84%的通道和15个Shortcut模块的轻量级模型,相对于通道剪枝84%的模型大小降低了32%、计算量减少17%、网络推理时间降低21ms,速度为通道剪枝84%模型的1.48倍。最后,基于TensorRT进行网络层融合,并使用半精度浮点数进行推理来提高推理速度。剪掉84%的通道和15个Shortcut模块的轻量级模型使用TensorRT优化后相对于Pytorch版本,运行速度提高30%,网络推理时间和后处理时间相加为41 ms,能够达到实时要求,模型的精度基本保持不变。综上所述,本文对车辆和行人目标检测模型的精度和速度进行了优化,减少了前景目标不平衡造成的漏检现象,最终在Jetson TX2上模型的推理时间与后处理时间满足实时性要求。