搬运系统作业分配问题的小脑模型关节控制器Q学习算法

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:kingtigerzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究两机器人高速搬运系统的作业分配问题.在系统的Markov决策过程(MDP)模型中,状态变量具有连续取值和离散取值的混杂性,状态空间复杂且存在“维数灾”问题,传统的数值优化难以进行.根据小脑模型关节控制器(CMAC)具有收敛速度快和适应性强的特点,运用该结构作为Q值函数的逼近器,并与Q学习和性能势概念相结合,给出了一种适用于平均或折扣性能准则的CMAC—Q学习优化算法.仿真结果说明,这种神经元动态规划方法比常规的Q学习算法具有节省存储空间,优化精度高和优化速度快的优势.
其他文献
超空泡航行器在航行过程中绝大部分被超空泡包裹,必然面临着航行器与空泡剧烈非线性作用力带来的稳定控制困难.针对超空泡航行器的控制问题,本文以Dzielski提出的航行器模型为研