为“强化学习智能体”提供性能基准

来源 :机器人产业 | 被引量 : 0次 | 上传用户:suhuisu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AlphaGo的横空出世让我们看到了强化学习在围棋领域的出色应用。目前DeepMind推出一款名为"DeepMind Control Suite"的控制套件,该控制套件旨在帮助我们利用强化学习技术实现对物理实体的操控,
其他文献
当前我国高职计算机软件技术专业人才培养模式单一,产学结合人才匮乏,针对当前状况对计算机软件技术专业进行分方向教学改革探索,并重点对Java语言方向教学方法改革、教学制
目的分析和探讨父母教养方式对暴力型罪犯人格的影响。方法采用人格诊断问卷(PDQ-4+)、父母教养方式问卷(EMBU)对176名暴力型罪犯(研究组)及189名普通人群(对照组)进行调查,
机器翻译通常利用深度学习技术来实现,而实现这一过程往往需要借助大量数据模型进行训练,这在一定程度上限制了小语种翻译的发展。针对这一困境,Facebook提出了无监督机器人
目的分析比较江苏省四城市PM2.5中多环芳烃的污染水平和特征,评估其健康风险。方法对南京、无锡、徐州、镇江5个监测点2016年1-12月PM2.5中16种多环芳烃进行分析,并在监测点