基于分层强化学习的多移动机器人避障算法

来源 :吉林大学学报(工学版) | 被引量 : 0次 | 上传用户:lvxinjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
介绍了一种基于分层思想的强化学习方法,即将机器人的复杂行为分解为一系列简单的行为进行离线独立学习,并分别设计了每个层次的结构、参数及函数。这种学习方法能够减小状态空间并简化强化函数的设计,从而提高了学习的速率以及学习结果的准确性,并使学习过程实现了决策的逐步求精。最后以多机器人避障为任务模型,将避障问题分解为躲避静态和动态障碍物以及向目标点靠近3个子行为分别进行学习,实现了机器人的自适应行为融合,并利用仿真实验对其有效性进行了验证。
其他文献
系统升级是每一个CIO都要遇到的问题。可是在升级之前,面对厂商提出的形形色色的升级方案,CIO该如何做到心中有数呢?
一个复杂的IT应用系统,往往是由不同厂家的软.硬件部件共同构成的,部件之间要频繁地交互信息。因为对于同一个IT设备的交互信息,不同的厂商有不同的规定,所以把不同厂商的部件组成
研究目的:探讨构建国土资源信息化工作体系的思路及方法。研究方法:文献资料法和对比分析法。研究结果:信息化工作是国土资源管理部门实践科学发展观的必然要求,国土资源信息化
为实现茶渣副产物资源的综合利用,提高茶渣蛋白提取率,用碱浸提法提取废茶渣蛋白,通过单因素试验分析不同提取温度、NaOH浓度、提取时间和液固比对茶渣蛋白提取得率的影响。
作为连锁零售行业最早实施ERP建设的企业,迪信通的ERP建设需要胆力更需要耐力。没有行业内成功案例做参考,迪信通ERP在摸索中历经曲折。