基于分层强化学习的多移动机器人避障算法

来源 :吉林大学学报(工学版) | 被引量 : 0次 | 上传用户：lvxinjj

【摘要】

：

介绍了一种基于分层思想的强化学习方法,即将机器人的复杂行为分解为一系列简单的行为进行离线独立学习,并分别设计了每个层次的结构、参数及函数。这种学习方法能够减小状态

【作者】

：

祖丽楠田彦涛梅昊

【机构】

：

吉林大学通信工程学院,吉林大学通信工程学院长春130022,长春130022

【出处】

：

吉林大学学报(工学版)

【发表日期】

：

2006年S2期

【关键词】

：

自动控制技术避障强化学习 Q-学习分层学习 automatic control technology obstacle avoidance reinfor

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

介绍了一种基于分层思想的强化学习方法,即将机器人的复杂行为分解为一系列简单的行为进行离线独立学习,并分别设计了每个层次的结构、参数及函数。这种学习方法能够减小状态空间并简化强化函数的设计,从而提高了学习的速率以及学习结果的准确性,并使学习过程实现了决策的逐步求精。最后以多机器人避障为任务模型,将避障问题分解为躲避静态和动态障碍物以及向目标点靠近3个子行为分别进行学习,实现了机器人的自适应行为融合,并利用仿真实验对其有效性进行了验证。

其他文献

问诊ERP“慢性病”

系统升级是每一个CIO都要遇到的问题。可是在升级之前，面对厂商提出的形形色色的升级方案，CIO该如何做到心中有数呢？

期刊

慢性病ERP问诊升级方案CIO厂商

规范IT信息交换是件大事

一个复杂的IT应用系统，往往是由不同厂家的软．硬件部件共同构成的，部件之间要频繁地交互信息。因为对于同一个IT设备的交互信息，不同的厂商有不同的规定，所以把不同厂商的部件组成

期刊

IT信息交换应用系统交互信息运营成本数据中心CNET部件

构建国土资源信息化工作体系的思路及方法——浅谈山西国土资源信息化建设方向

研究目的：探讨构建国土资源信息化工作体系的思路及方法。研究方法：文献资料法和对比分析法。研究结果：信息化工作是国土资源管理部门实践科学发展观的必然要求,国土资源信息化

期刊