论文部分内容阅读
针对增强型算法中求解目标状态问题,提出了反映当前状态与目标状态的距离和转换代价的优化模型,设计了基于优化状态转换信任度的增强型学习算法COSTRLA.算法定义了优化状态信任度函数,设计了优化状态信任度函数的更新学习规则. COSTRLA用于求解迷宫问题,表明了算法在处理目标状态问题时比传统的增强型学习算法更加有效.