折扣与无折扣MDPs:一个基于SARSA(λ)算法的实例分析

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:bbpooh123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了折扣激励学习存在的问题,对MDPs的SARSA(λ)算法进行了折扣的比较实验分析,讨论了平均奖赏常量对无折扣SARSA(()算法的影响。
其他文献
论文在界定了地方高校生态文明教育的概念和内容体系的基础上,对当前地方高校生态文明教育的现状进行了分析。
分析了销售管理的业务模型和多层分布式体系结构,提出了同方销售管理系统TFCM的功能模型和多层分布式结构模型,采用组件技术进行了设计与实现,并针对若干问题提出了优化方法。
文章重点研究了基于DCT变换的数字水印技术,提出了一种水印算法,将二维图像作为水印嵌入到数字作品中,并且进行了验证,实验证明这种方法是可行的。
在我国,20kV电压等级曾经出现过很长一段时间,后来被35kV所替代;随着电网发展和负荷密度不断提高,20kV作为配电电压代替10kV再次受到关注。本文对20kV配电电压等级的历史沿革