论文部分内容阅读
近年来,随着智能化技术的快速发展,自动驾驶系统已然成为相关行业的研究热点。自动驾驶系统应用多种传感器采集得到不同类型的自动驾驶数据,这些数据将用于环境感知、地图及定位、规划与控制等关键任务中,对系统的平稳、安全、有效运行具有重要意义。随着深度学习的再次兴起,自动驾驶系统中大量采用深度学习算法来完成目标检测与跟踪等任务,算法性能需要大规模高质量数据的支持,并且训练针对特定场景的深度学习算法时,训练数据也需要满足一定条件。为满足以上需求,本文提出了构建面向自动驾驶的数据平台,并对其中所应用的关键技术进行研究,旨在设计并实现一个能够对自动驾驶数据进行有效管理和使用,对深度学习算法训练提供有效数据支持的数据平台。本文对数据平台进行了详细的需求分析。首先从数据统一表示、标注数据规模与难例样本对算法性能影响的角度对数据平台需求进行了概述;接下来从数据平台运行场景和功能需求两个方面进行了分析;然后对平台中不同角色的业务流程进行了阐述。本文重点对数据平台中应用的相关理论及关键技术进行了研究。首先研究了对不同类型自动驾驶数据进行统一表示的数据表示模型,分别对模型元素及元素关系进行了设计,该套模型对数据类型透明,围绕数据控制流进行操作,能够保证平台的通用性和可扩展性;接下来对基于生成对抗网络和卷积神经网络的自动驾驶图像生成算法进行了研究,构建由多尺度判别器和多分辨率作业线生成器组成的生成对抗网络,使用该生成器对自动驾驶图像数据进行有效扩充;然后对Parquet文件存储格式、HDFS和Spark SQL相结合的数据检索与数据集管理方案进行了研究,对不同技术与方案进行了对比测试,结果表明该方案能够显著提高数据存储与查询的综合性能。本文最后详细介绍了数据平台的设计与实现方案。对平台进行了系统功能设计、框架结构设计、业务流程设计以及数据库设计;通过类图和时序图分别介绍了主要功能模块的实现过程和实现逻辑,并给出了系统运行结果。