论文部分内容阅读
随着人工智能技术的高速发展,无人驾驶技术正“驶入”发展快车道。无人驾驶汽车需要准确感知周围的环境才能正常运行,基于深度学习的感知系统将周围环境数据转化为能够应用于自动驾驶的语义信息。3D车辆检测技术是感知系统的基本组成部分,可以感知周围车辆的尺寸和位置信息。与传统的2D目标检测不同,3D车辆检测融合了单目深度估计,角度估计等任务。当前3D车辆检测算法根据传感器种类分为两类,基于点云的算法需要价格昂贵的深度采集设备,而基于单目图像的算法检测性能较差。针对现有3D车辆检测研究的缺陷和不足,本文对基于单目相机的车侧3D车辆检测算法进行研究,整个3D车辆检测网络由两个部分组成,一部分预测车辆的2D边界框,另一部分预测车辆的3D信息,包括车辆位置、尺寸和航向角信息。本文主要工作如下:1.目前3D车辆检测算法多数以2D车辆检测的结果作为先验知识,现有2D车辆检测算法未能充分捕捉车辆的空间特征。本文为提升卷积神经网络对单目图像特征的提取能力,提出一个高效2D车辆检测架构,通过迁移学习的方式,将更有效的特征输入检测模型,从而提升2D车辆检测模块的性能,在KITTI 2D车辆检测数据集中取得了 90.49%AP(Average Precision)的准确率。2.对于单目RGB图像缺少深度信息的情况,本文提出一种基于密集空间金字塔池化的实例深度估计模块。该模块引入一种金字塔池化结构,采用了多尺度学习策略,通过将扩张卷积密集连接的方式,在不牺牲空间分辨率的情况下,进一步提升了深度估计模块的感受野,有效的获取单目图像的空间上下文特征,能够预测每个实例车辆的深度信息。在KITTI 3D车辆检测数据集中取得了有竞争力的表现,取得35.56%AP3D的准确率。3.针对角点估计中回归角点的不准确性,提出一种角点约束损失函数,从车辆尺寸和航向角两个方面对车辆3D边界框进行约束,并探索最优的训练方法,并进行有效性分析。实验证明损失函数改进能够进一步提升3D车辆检测的性能。