为“强化学习智能体”提供性能基准

来源 :机器人产业 | 被引量 : 0次 | 上传用户：suhuisu

【摘要】

：

AlphaGo的横空出世让我们看到了强化学习在围棋领域的出色应用。目前DeepMind推出一款名为＂DeepMind Control Suite＂的控制套件,该控制套件旨在帮助我们利用强化学习技术实现对

【作者】

：

【出处】

：

机器人产业

【发表日期】

：

2018年1期

【关键词】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

AlphaGo的横空出世让我们看到了强化学习在围棋领域的出色应用。目前DeepMind推出一款名为＂DeepMind Control Suite＂的控制套件,该控制套件旨在帮助我们利用强化学习技术实现对物理实体的操控,

其他文献

当前我国高职计算机软件技术专业人才培养模式单一,产学结合人才匮乏,针对当前状况对计算机软件技术专业进行分方向教学改革探索,并重点对Java语言方向教学方法改革、教学制

期刊

目的分析和探讨父母教养方式对暴力型罪犯人格的影响。方法采用人格诊断问卷(PDQ-4+)、父母教养方式问卷(EMBU)对176名暴力型罪犯(研究组)及189名普通人群(对照组)进行调查,

期刊

机器翻译通常利用深度学习技术来实现,而实现这一过程往往需要借助大量数据模型进行训练,这在一定程度上限制了小语种翻译的发展。针对这一困境,Facebook提出了无监督机器人

期刊

机器翻译自动编码器无监督

目的分析比较江苏省四城市PM2.5中多环芳烃的污染水平和特征,评估其健康风险。方法对南京、无锡、徐州、镇江5个监测点2016年1-12月PM2.5中16种多环芳烃进行分析,并在监测点

期刊