一种基于优化状态转换信任度的增强型学习算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户：wycgdxx86

【摘要】

：

针对增强型算法中求解目标状态问题,提出了反映当前状态与目标状态的距离和转换代价的优化模型,设计了基于优化状态转换信任度的增强型学习算法COSTRLA.算法定义了优化状态信

【作者】

：

柏挺峰吴耿锋

【机构】

：

上海大学计算机科学和工程学院

【出处】

：

计算机工程

【发表日期】

：

2004年1期

【关键词】

：

增强型学习动态规划目标状态最短路径 Reinforcement learning Dynamic programming Goal state Th

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对增强型算法中求解目标状态问题,提出了反映当前状态与目标状态的距离和转换代价的优化模型,设计了基于优化状态转换信任度的增强型学习算法COSTRLA.算法定义了优化状态信任度函数,设计了优化状态信任度函数的更新学习规则. COSTRLA用于求解迷宫问题,表明了算法在处理目标状态问题时比传统的增强型学习算法更加有效.

其他文献

一种建立单片机应用系统菜单的新方法

提出了一种用一维线性数组实现树形拓扑结构多级菜单的方法，并用C51语言编程验证了这种方法的可行性。该方法对存储资源的利用效率高，逻辑关系清晰，且菜单的建立和修改方便，适合

期刊

多级菜单一维线性数组C51Multistage menu Linear array of the one dimension C51

长距离宽带网络互联通道的设计与实现

介绍了一种简单实用的长距离网络互联方案,着重讨论了其管理和运行模式、设备选择、路由策略和带宽分配等问题.

期刊

路由策略网络互联ACLNATRouting policy Network interconnection ACL NAT

视频转换编码中的压缩域运动补偿技术

研究视频转换编码中的压缩域运动补偿技术，对已有算法加以补充和完善，解决了现有算法不能处理运动矢量为负的问题。从具体实现角度，给出了详细的算法和必要的分析。实验结果表明

期刊

转换编码压缩域运动补偿空间分辨率Transcoding Compressed domain Motion compensation Spatial

一种基于优化状态转换信任度的增强型学习算法

其他学术论文