论文部分内容阅读
近年来,随着网络购物带来的配送任务的增加,以及2020年疫情扩散对隔离的需求,社会对无人配送的工具也越来越重视。而在人工智能技术不断发展的情况下,智能配送机器人应用逐渐成熟,被广泛应用在快递、外卖等日常生活场景中;此外,在疫情期间,医疗场景下配送机器人的需求也愈发紧迫,除了可以降低医护人员的繁杂劳动量外,也可在一定程度上避免了人员之间的交叉感染。本文主要针对自主配送机器人在避障导航技术上的难点,为了应对室内的障碍物密集流动、种类复杂等实际问题,以深度强化学习(deep reinforcement learning,DRL)中的SAC(soft actor-critic)算法为基础,对配送机器人避障导航问题进行建模研究。主要内容如下:(1)本文针对实际应用场景下的障碍物密集繁杂等问题,提出了一种并行SAC(parallel SAC,PSAC)的训练算法用于训练机器人的避障导航能力,这在加快训练速度的同时,也提升了模型的泛化性能,从而满足机器人的灵活性和稳定性需要。在模型测试阶段,对比了SAC算法和传统的人工势场(artificial potential field,APF)算法之间性能的差异性。最后将训练完成的模型迁移到以RGBD相机为观测传感器的真实机器人上,在实验中机器人可以灵活的避开动态行人,结果证明了本文提出的算法具有较强的实用性。(2)针对障碍物种类复杂,导致单一传感器无法获得完备观测信息的问题,本文提出了基于深度学习的RGBD相机与超声波传感器的数据融合方法,通过修正训练数据或网络结构的方式,可以方便地将数据融合算法纳入SAC避障算法下。实验表明,经过数据融合,机器人在透光或不透光障碍物场景下都可以具备良好的稳定性。(3)针对长距离的避障导航任务,本文提出了结合RRT(Rapidly exploring Random Tree,快速扩展随机树)的RRT-SAC避障导航算法。先利用RRT算法路径规划,将长路径划分为若干短路径,再调用SAC算法处理短距离的避障导航任务。实验表明了RRT-SAC方法可以有效的解决长路径的避障导航问题。本文在配送机器人避障导航技术方面的研究,可为该领域的进一步研究提供参考。