未知环境下基于有先验知识的滚动Q学习机器人路径规划

来源 :控制与决策 | 被引量 : 0次 | 上传用户：mooreman009

【摘要】

：

提出一种未知环境下基于有先验知识的滚动Q学习机器人路径规划算法.该算法在对Q值初始化时加入对环境的先验知识作为搜索启发信息,以避免学习初期的盲目性,可以提高收敛速度.

【作者】

：

胡俊朱庆保

【机构】

：

南京师范大学计算机科学与技术学院,江苏省信息安全保密技术工程研究中心,

【出处】

：

控制与决策

【发表日期】

：

2010年09期

【关键词】

：

滚动路径规划移动机器人先验知识 Q学习未知环境

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出一种未知环境下基于有先验知识的滚动Q学习机器人路径规划算法.该算法在对Q值初始化时加入对环境的先验知识作为搜索启发信息,以避免学习初期的盲目性,可以提高收敛速度.同时,以滚动学习的方法解决大规模环境下机器人视野域范围有限以及因Q学习的状态空间增大而产生的维数灾难等问题.仿真实验结果表明,应用该算法,机器人可在复杂的未知环境中快速地规划出一条从起点到终点的优化避障路径,效果令人满意. This paper proposes a path planning algorithm based on prior knowledge of rolling Q learning robots in unknown environment.This algorithm adds priori knowledge of environment to search enlightenment information when initializing Q to avoid the blindness in the initial stage of learning and can improve Convergence rate.At the same time, the method of rolling learning is used to solve the problem of the limited scope of robot’s field of view in large-scale enviroment and the dimensionality disaster caused by the increase of the state space of Q learning.Experimental results show that using this algorithm, In a complex and unknown environment, an optimal obstacle avoidance path from the starting point to the end point is rapidly planned, and the result is satisfactory.

其他文献

即时定量PCR-Sanger测序与TaqMan探针法检测结直肠癌K-ras、B-raf基因突变的对比分析

目的对比分析两种不同方法检测K-ras、B-raf基因突变的应用价值；探讨结直肠癌K-ras和B-raf基因突变与临床及病理的相关关系；探讨K-ras和B-raf基因突变与结直肠癌预后的相关关系

学位

结直肠癌即时定量PCR-Sanger测序法Taqman探针法K-ras基因B-raf基因

中西医结合治疗肝硬化腹水40例

我院1990年1月～2000年12月采用自拟茵丹五苓散配合多巴胺、速尿静脉点滴治疗肝硬化腹水患者40例,取得满意效果,现报道如下.

期刊

肝硬化腹水治疗组五苓散疗效标准中西医结合治疗

关于加快推进杭州市智能制造促进产业转型发展的指导意见(节选)

<正>杭政函[2015]128号重点任务(一)加快发展智能制造技术、产品和服务主动对接"中国制造2025",立足杭州制造业向智能制造、绿色制造、高端制造发展的现实需求和重点方向,加

期刊

智能制造产业转型“四基”绿色制造高端制造杭州市

慢性粒细胞白血病的实验分析和临床研究

研究背景：慢性粒细胞白血病(CML)是一类发生在造血干细胞的以髓系细胞慢性增殖为主要特征的恶性克隆性疾病,95%的患者骨髓中可找到Ph染色体,即t(9；22)(q34；q11),这一易位使正常

学位

荧光定量PCR肝素BCM-ABL P210基因伊马替尼慢性粒细胞白血病造血干细胞移植造血重建急性心衰移植相关早期并发症预后

三种基本完全信息静态博弈模型在上市公司中的应用

我国上市公司之间和上市公司内部存在着许多的博弈,但是由于动态博弈和不完全信息博弈的复杂性,限制了相应的博弈模型在这方面的应用。文章运用三种基本的完全信息静态博弈模

期刊

上市公司完全信息静态博弈利益最大化

人性与激情——简析西班牙电影《不良教育》

台湾著名作家朱天文曾经说过:“按作者论的说法,一个导演一生只在拍一部电影。”①西班牙的鬼才导演阿尔莫多瓦迄今为止虽然已经拍摄了十五部影片, 但它们共同的暖昧大胆、华

期刊

阿尔莫多瓦《不良教育》

Notch3蛋白在非小细胞肺癌中的表达及其临床意义

背景：肺癌是当今世界上最常见也是死亡率最高的癌症之一,它是男性癌症患者中最主要的癌症类型,占新增癌症病例总数的17%和癌症死亡病例的23%,而且在北美,欧洲部分地区和中国也

学位

Notch3非小细胞肺癌免疫组织化学预后

路遥的乡土情结

本文揭示出路遥创作中＂乡土情结＂的深层精神意蕴：童年心灵的巨大乡土意识投影；农民式的乡土观念和理想；对土地与人的艺术哲学思考。

期刊

路遥乡土情结文化性格

浅谈音乐教学中游戏的筛选策略

音乐游戏是一种活泼、生动的教学方式,兼具音乐课的文娱性与儿童游戏的趣味性,比较符合儿童的审美情趣与身心发展规律.教师应灵活自如地将音乐游戏融入音乐教学中,通过律动游

期刊

音乐教学音乐游戏律动游戏歌舞游戏角色游戏

ELAM-1在鼻咽癌组织中表达及其与临床特征关系的研究

目的:探讨内皮性白细胞黏附分子-1(ELAM-1)在鼻咽癌组织中的表达及其与临床特征的关系。方法:应用免疫组织化学染色技术检测46例鼻咽癌患者组织中ELAM-1的表达,按转移与否分

期刊

鼻咽癌ELAM-1转移

未知环境下基于有先验知识的滚动Q学习机器人路径规划

其他学术论文