基于深度学习的自动驾驶道路场景理解算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:hsgnln
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习和计算设备的不断发展,复杂模型能够实时运行在并行计算设备中,使得人工智能技术从理论研究走向了实际应用。场景理解是计算机视觉技术中主要领域之一,其通过捕获数据间的上下文关系,实现对客观世界的认知。随着汽车智能化的不断推进,自动驾驶汽车成为研究热点之一。在自动驾驶技术中,道路场景理解能够分解道路交通中的要素,是使汽车能够路径规划与决策的先决条件之一。针对于不同的交通要素,结构化的分解适应不同的检测方式是必要的。本文将场景理解算法分解为目标检测与语义分割两种算法,针对不同的交通要素通过定位识别与像素级别分类,来判断空间位置和语义关系。自动驾驶场景中,视觉系统的实时性、灵敏度、快速解读能力、精准性是自动驾驶系统保障,如何平衡速度与精度,将算法合理应用于边缘计算设备中,对实际落地有着重大的实际意义。本文针对道路场景中语义问题,通过结构化分解交通要素,利用目标检测与语义分割算法,旨在通过细腻度较高的识别,达到更精细化的理解道路间的空间位置分布关系及其语义信息。主要研究成果如下:1.从全局特征来捕获上下文关系是提升语义分割精准度的关键之一,本文利用空间空洞卷积和残差思想提出了一种感受野模块,旨在通过全面的感受野覆盖,分析图像间的语义关系,结合UNet语义分割网络的密集跳层连接方式,能够实现61FPS的推理速度。2.针对目标检测的定位与识别能力,提出一种结合深度可分离卷积、空间金字塔空洞卷积、密集跳层的目标检测网络,其在四维图新自动驾驶数据集上,输入图像为608×608分辨率下,能实现44%mAP和12.5FPS,优于YOLOv3和Cascade R-CNN,证明其在速度和准确度能够很好地适应边缘计算性能。3.针对语义分割的鲁棒性,本文提出一种基于形态学和最大连通域的后处理算法,旨在消除分割结果中错误区域、空洞、毛刺等情况,通过实验证明其能够对语义分割结果有小幅度的提升,能够有效增加语义分割的稳定性。4.为了提升道路场景理解算法在边缘计算中的推理能力,通过模型量化,将网络部署于NVIDIA Jetson Xavier NX嵌入式平台中,使得目标检测网络推理速度为6FPS,语义分割网络推理速度12FPS。综上所述,本文结合图像处理、目标检测、语义分割,利用不同层次场景理解的结合,通过深度学习的方式,使得图像抽象出特征表达出更丰富交通信息。通过对交通场景理解进行了深入研究,从理论推导到模型设计,从算法验证到模型部署,具有一定理论意义和实用价值。
其他文献
主轴径向回转误差是衡量与评估主轴工作性能与工作精度的重要指标,对于预测和控制依靠主轴工作的高端装备所加工工件的质量具有重要意义,如何检测并分离出高精度的主轴径向回转误差成为近年来研究的热点。国内外学者研究并提出了反向法、多步法以及多点法等误差检测方法,但由于受到传感器安装定位角度、索引和二次定位工件精度等不确定因素的影响,其误差检测与分离精度不高。针对上述难点,本文提出了一种适用于精密主轴高精度误
目前航空航天、军工等领域的机械零部件上都存在着铝基复合材料的应用,在制造以及使用过程中,铝基复合材料中可能存在的完全脱粘、局部脱粘等粘接质量问题会直接影响材料使用性能,对于粘接质量的检测主要分为界面结合状态的检测和界面结合强度的检测,而使用激光层裂法测量界面结合强度等方法均需要以测量界面结合状态为基础,本文主要应用超声波无损检测方法对铝基复合材料的界面结合状态进行检测。本文采用铝基板,玻璃,聚四氟
双足爬壁机器人具有出色的越障与过渡能力以及执行作业的能力,是执行高空高危作业的理想选择。当前,缺乏在作业环境中精确定位与导航的能力是制约双足爬壁机器人产业化应用的重要原因。本文以实验室自研的双足爬壁机器人为载体,针对双足爬壁机器人在三维壁面环境中的定位与导航问题,探索了一种基于建筑信息模型与Ar Uco标记的单目视觉定位与偏航校正方案。本文的主要研究内容如下:1.基于Revit开发了从建筑信息模型
公交到站时间是乘客需要的重要信息,准确的到站时间预测可以减少出行者等待时间、缓解焦虑情绪、提升公交服务水平。站点客流预测是公交发班时刻表制定和公交线路规划的重要依据,准确的客流预测可以提高公交资源利用效率、缓解站点客流拥堵。本文构建基于深度神经网络的滚动预测模型,以广州实际公交、客流数据为例,探讨提升公交到站与站点客流预测准确性的方案,并依据需求分析在大数据平台上设计、实现公交预测系统,主要内容如
随着时代的飞速发展和技术的不断革新,医疗保健床不断地趋于自动化、智能化、人性化,但是结合传统中医艾灸和现代机械的艾灸床的发展却落后于时代的步伐,没有适用的监控系统。本文利用嵌入式技术,并根据艾灸床的机械结构和工作原理,设计开发了一种适用于医用艾灸床的监控系统,也是首次将监控系统运用到艾灸床当中。本文采用STM32F103ZET6作为整个监控系统的主控芯片,使用温度传感器检测艾灸床工作时的温度,使用
膝关节损伤在各个年龄段都十分常见,膝关节损伤患者如果在术后接受科学合理的康复训练,将有助于患者的术后康复。为辅助膝关节损伤患者的术后康复训练,市面上出现了一种可调式膝关节支具。患者在佩戴该支具后,支具可以将患者膝关节的弯曲角度控制在指定的范围内,让患者可以循序渐进的锻炼自己的膝关节。个性化康复支具是对现有膝关节支具的改进。与可调式膝关节支具相比,个性化康复支具依据患者的形态特征进行设计,可以完全与
随着电子工业的蓬勃发展,微纳加工制造成为众多半导体器件制造企业的重大需求。微纳精密电子制造产业是我国综合制造能力迈向新时代的关键一步。基于柔性机构的微动定位平台作为微纳加工制造装备中的核心部件之一,因其高分辨率、快速响应的特点被广泛应用于定位运动台、微操作器、原子力显微镜等诸多领域。由于压电陶瓷的位移受其长度的限制,为了延长压电陶瓷的行程范围,人们开发了各种放大机构。利用放大机构,虽使压电陶瓷所采
无人驾驶技术作为当今前沿科技的重点研究对象,对经济增长、道路安全、国防建设等有巨大的推动作用。环境感知技术作为无人驾驶关键技术之一,决定了无人驾驶车辆能否获知全面的道路信息并规划出安全合理的行驶路线,因此具有重要的研究意义。本文依托中国大学生无人驾驶方程式大赛(Formula Student Autonomous China,FSAC)对FSAC赛车环境感知技术进行研究,拟解决当前FSAC赛车因环
光接收器是光纤传输系统的重要组成部分,接收器的性能决定了传输质量。因此,本文将基于低噪声、低干扰角度,对拉曼光纤放大器(Raman Fiber Amplifier,简称RFA)和光时域反射仪(Optical Time Domain Reflectometer,简称OTDR)两者的光信号接收模块的电路进行研究。RFA利用泵浦光源对在光纤中传输的光信号进行放大,多路泵浦激光器能够同时对光纤内传输的多波
液晶透镜自1979年被提出以来就备受国内外众多相关科研工作者的重视。基于液晶材料的光电特性,使液晶材料应用于透镜时可以在不改变自身形状的情况下,依靠控制空间电场分布来改变液晶的折射率,其光学性能的调节得以实现。相较于传统变焦透镜,液晶透镜具有体积小、变焦灵活、无机械磨损等优势,在光学影像、光电系统、生物医学等众多领域上具有巨大应用潜力。空间电场分布的控制是液晶透镜调节光学性能的关键,本文针对液晶透