【摘 要】
:
移动机器人在经济社会中有着广泛的应用,覆盖了工业、农业、商业等领域。自主导航能力是移动机器人最基础的功能,移动机器人的其他功能都是以此为前提。移动机器人导航技术包含环境感知、建图与定位和路径规划三个要素。其中,为移动机器人建立地图需要耗费大量时间和精力,而且随着导航环境的变化,地图也需要重新绘制,才能保证移动机器人的导航效果。在某些情况下,如军事侦察、资源勘探、抗震救灾等,移动机器人在执行导航任务
【基金项目】
:
国家自然科学基金项目—自主装修机器人关键技术;
论文部分内容阅读
移动机器人在经济社会中有着广泛的应用,覆盖了工业、农业、商业等领域。自主导航能力是移动机器人最基础的功能,移动机器人的其他功能都是以此为前提。移动机器人导航技术包含环境感知、建图与定位和路径规划三个要素。其中,为移动机器人建立地图需要耗费大量时间和精力,而且随着导航环境的变化,地图也需要重新绘制,才能保证移动机器人的导航效果。在某些情况下,如军事侦察、资源勘探、抗震救灾等,移动机器人在执行导航任务前无法得知环境地图,这极大地限制了移动机器人的广泛使用。本文重点关注基于深度强化学习的移动机器人导航技术。我们以移动机器人配备的激光雷达作为输入,采用深度强化学习算法作为决策模块,引导移动机器人在仿真环境中规避障碍物并到达目标点位置。移动机器人不需要预先对环境建立地图信息,而是通过与环境的不断交互,获取来自环境的反馈,进而学习到潜在的导航策略。深度强化学习的输入源包括距离信息、障碍信息、子目标、角度等多维信息,有移动机器人的决策提供了有效支撑。本文的主要创新如下:1.本文把一种基于分层架构模型的强化学习导航方法——h-DQN(Hierarchical Deep Q-Learning)应用在移动机器人导航任务上。这种分层架构的学习过程把导航任务划分了两个阶段,选取子目标和执行具体动作。该方法把传统的导航过程看成是一系列在时序上连续的子问题,通过不断解决子问题从而完成导航任务,提高了移动机器人在复杂环境下执行导航任务的成功率。2.我们在移动机器人导航算法中加入了LSTM(Long Short-Term Memory)网络,加快了强化学习算法的收敛速度和提高了面临新环境时的泛化能力。引入了LSTM的强化学习算法能在算法稳定时取得更高的奖励值。在实验部分,我们使用Gazebo仿真器搭建了2个简单导航环境和2个复杂导航环境,分别使用DQN和h-DQN两种算法指导Turtle Bot3机器人执行导航任务。实验结果表明,DQN和h-DQN均能完成导航任务,但后者在面临复杂环境时导航成功率更高。除此之外,采用了LSTM记忆模块的强化学习算法收敛速度更快。在移植算法到新环境时,h-DQN很好地利用了预训练的先验知识,而DQN则可能出现算法无法收敛的情况。
其他文献
从社会生产方式变革的视角来审视人工智能现代技术与"两个必然"这一经典理论,是出于对生产方式自身特殊"中介"地位和相对具体性的考量。人工智能时代生产方式变革的背景与趋势包括人工智能的"双重性质"、生产方式变革过程中的"双重关系"以及生产方式变革的"双重结果"。当下以人工智能新技术为"驱动"的生产方式变革,应该上升到"创造性破坏"的阶段,对资本主义生产关系进行彻底颠覆,这也是实现"两个必然"的内在逻辑
社会经济的飞速发展,使得人民生活水平在不断提高,在该背景下人们对建筑工程的要求也在逐渐提高,建筑工程无论是在规模上还是数量上都较以前有了质的飞跃。本文就建筑工程预算展开探讨,分析了工程预算在建筑工程造价控制中发挥的作用。
目的探讨儿童百日咳的临床特点,并进行早期诊断的预测因素分析。方法收集2018年7月—2020年7月在中山大学附属第五医院儿科疑诊百日咳的84例患儿住院病历资料,按呼吸道分泌物百日咳PCR检测是否阳性分为百日咳组和类百日咳组,比较两组患儿的临床特点,并进一步行Logistic回归分析探讨诊断的独立预测因素。结果共有84例患儿纳入研究,其中百日咳组38例,类百日咳组46例,两组患儿未接种疫苗、鸡鸣样回
档案宣传工作是档案事业的重要组成部分。学校档案宣传工作则是拉近档案与师生距离,普及档案知识的有效途径。在新兴媒体迅速发展的情况下,利用微博、微信等新媒体进行档案宣传工作,不仅能促进档案工作顺利开展,而且能扩大档案影响力,为今后各项档案工作的开展提供契机。
目的了解聊城市百日咳发病现状和流行病学特征,为制定控制策略提供科学依据。方法采用描述性流行病学方法对2018~2020年聊城市百日咳疫情资料进行分析。结果 2018~2020年聊城市累计报告百日咳病例1 091例,年均发病率为5.98/10万。2018~2020年发病率分别为10.95/10万、6.49/10万、0.54/10万,差异有统计学意义(P<0.01)。东阿县发病率最高(58.48/10
受传统数据管理模式以及查询方式的制约,现有的公安数据存储缺乏统一的标准规范,"信息孤岛"现象突出。因此,在公安案件关联、线索碰撞时,往往会发生数据找不到、衔接不上的窘境。多种异构数据情境下,公安知识图谱创建能够从多种数据源中异构提取知识,经过信息抽取、知识加工和知识融合,实现公安知识互联,使侦查有数据可查、有迹可循,加速侦查人员获取有效信息的效率,提高侦查人员对数据的掌控和利用水平。另外,利用公安
在小学信息技术课程中,Scratch编程受到了学生的广泛喜爱,很多学生到达机房的第一件事就是打开"小猫"软件,但随之也出现了一些问题与潜在的危机。为化解问题与危机,鼓励教师在Scratch课堂教学中培养学生的创新思维。本文通过研究Scratch编程在小学信息技术课程中的应用,归纳了指向学生创新思维培养的Scratch教学策略。