切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
折扣奖赏相关论文
平均奖赏MDP的在策略无模型激励学习算法
本文以随机逼近的形式,提出了一些用于求解平均奖赏Markov决策过程系统方程的在策略无模型激励学习算法。这些算法与广泛且成功 应......
期刊
激励学习
MARKOV决策过程
平均奖赏
折扣奖赏
人工智能
reinforcement learningMarkov decision process(MDP
看过本文同时还关注
如何写好一篇毕业论文
免费论文查重的方法
从零开始写毕业论文的方法
热心助人的动物
第一届全国脊柱脊髓基础研究及临床...
2004世界科技七大看点
对甘肃省国有企业兼并问题的思考
热心助人的动物
对甘肃省国有企业兼并问题的思考
热心助人的动物