基于深度强化学习的移动机器人在多个动态障碍物环境下避障研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:h135zy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动机器人的出现,提高了社会的生产效率。移动机器人的难点在于避障,尤其是在有动态障碍物的环境中,移动机器人与动态障碍物之间没有相互的通信情况下,动态障碍物的目标点无法被移动机器人得知。除此之外,为了找出花费时间最短的路径,通常还需要考虑动态障碍物之间的相互的影响,如果运用传统的解析法,计算量是巨大的,例如最佳相互避免碰撞算法。目前移动机器人动态避障存在着计算量大,实时性差,动态障碍物数量增加稳定性变差等问题。本文为了解决这些问题,提出一种基于深度强化学习的方法来避免移动机器人与动态障碍物发生碰撞。本文主要研究移动机器人动态避障问题,根据移动机器人特点和要完成的任务,设计一个深度强化学习模型。使用部分可观测的信息,在移动机器人与动态障碍物互不通信的情况下移动机器人能够无碰撞到达目标。该模型在深度Q网络基础上做出针对性的改进,引入长短时记忆神经网络对状态进行预处理,同时对于经验池的设置进行修改。本文通过仿真验证算法的可靠性和稳定性,仿真结果表明经过改进方法更加稳定,移动机器人到达指定目标点的时间缩短。为了动态障碍物数量增加时算法依然稳定,引入了注意力机制,使得移动机器人在作决策时更加关注那些更具影响力的临近动态障碍物。结果表明,加入注意力机制的算法,在动态障碍物数量增加的情况下依然能够在短时间内无碰撞到达目标点,算法的稳定性高于传统的方法以及基于长短时记忆神经网络的深度强化学习方法。
其他文献
将普通共沉淀法制备的LaNiO3复合氧化物进行超声波处理,以NO、CO的催化燃烧为模型反应,考察超声波处理对LaNiO3复合氧化物催化活性的影响.采用TEM、SEM、BET和XPS等表征手段
【摘要】聚焦课程游戏化背景下的儿童阅读,教师应逐步转变“阅读即看书”的理念,不断对“课程游戏化”与“儿童阅读”“品德教育”等内容进行有效融合。在绘本阅读活动中,教师要不断创新教学方式,挖掘绘本中蕴藏的德育内涵,利用并挖掘绘本中的德育素材,开展实践活动,帮助幼儿接受美的熏陶,提升德育实效。  【关键词】绘本阅读;幼儿园;德育启蒙;课程游戏化  幼儿德育作为道德教育的起始阶段,在继承传统幼儿德育发展中
结合石安高速公路的养护施工,对传统挖补和就地热再生两种处治路面病害的方案作了对比分析,结果显示,就地热再生方案在解决施工交通拥堵、处理深层裂缝、节省养护成本及节能环保
虚拟化与云计算技术的快速发展以及各类新型网络业务的不断出现催生了对网络功能的更高需求。传统网络结构不堪重荷之时,SDN技术应运而生。SDN将原本封闭的硬件形式的网络结
目的:探讨额角钻孔置管引流治疗高血压脑出血破入脑室的特点和经验,如何降低高血压脑出血破入脑室患者的病死率及致残率,提高患者生存质量。方法:回顾分析120例高血压脑出血破
以赞比亚T2公路Kafue段的再生维修工程为依托,介绍了就地冷再生维修方案、机器配置、设备工作原理、施工过程、工艺优势与施工组织,针对机械油耗、材料添加、设备租用、人员配
为实现实验室中对橡胶沥青与石料间粘结力的快速测试,设计了一种基于螺旋传动的简易装置,介绍其工作原理,并做了可行性分析及相关试验。试验结果表明:特定目数下,粘结力最大值随掺
我国的制造业正在进入“中国制造2025”战略的“深水期”。提高全要素生产率水平是制造业企业实现转型发展,提升企业的核心竞争力的关键。本文以2012-2018年的制造业上市公司
索尔·贝娄是20世纪美国著名作家,他被认为是继海明威、福克纳之后最伟大的当代美国小说家之一。他一生阅历丰富,在长达60年的创作生涯中,贝娄共计出版十三部长篇小说,大量中
采用有限元方法,开发相应的用户子程序,将Mohr—Coulomb弹塑性本构与地基土体弹性模量随深度连续增加非均质地基模型相结合,分析了地基基础的埋置深度、地基的非均质性等因素对