切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
为“强化学习智能体”提供性能基准
为“强化学习智能体”提供性能基准
来源 :机器人产业 | 被引量 : 0次 | 上传用户:suhuisu
【摘 要】
:
AlphaGo的横空出世让我们看到了强化学习在围棋领域的出色应用。目前DeepMind推出一款名为"DeepMind Control Suite"的控制套件,该控制套件旨在帮助我们利用强化学习技术实现对
【作 者】
:
Yuval Tassa
【出 处】
:
机器人产业
【发表日期】
:
2018年1期
【关键词】
:
强化学习
CO
基准测试
智能体
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AlphaGo的横空出世让我们看到了强化学习在围棋领域的出色应用。目前DeepMind推出一款名为"DeepMind Control Suite"的控制套件,该控制套件旨在帮助我们利用强化学习技术实现对物理实体的操控,
其他文献
Java语言方向教学改革探讨
当前我国高职计算机软件技术专业人才培养模式单一,产学结合人才匮乏,针对当前状况对计算机软件技术专业进行分方向教学改革探索,并重点对Java语言方向教学方法改革、教学制
期刊
Java语言方向教学改革
高职计算机专业教学
人才培养模式
成年男性暴力型罪犯人格特征与父母教养方式的相关性
目的分析和探讨父母教养方式对暴力型罪犯人格的影响。方法采用人格诊断问卷(PDQ-4+)、父母教养方式问卷(EMBU)对176名暴力型罪犯(研究组)及189名普通人群(对照组)进行调查,
期刊
暴力型罪犯
人格特征
人格偏离
父母教养方式
Violent offendersPersonality traitsPersonality deviationP
没有数据如何翻译?一文读懂“无监督”机器翻译
机器翻译通常利用深度学习技术来实现,而实现这一过程往往需要借助大量数据模型进行训练,这在一定程度上限制了小语种翻译的发展。针对这一困境,Facebook提出了无监督机器人
期刊
机器翻译
自动编码器
无监督
江苏四城市PM2.5中多环芳烃室外呼吸暴露健康风险评估
目的分析比较江苏省四城市PM2.5中多环芳烃的污染水平和特征,评估其健康风险。方法对南京、无锡、徐州、镇江5个监测点2016年1-12月PM2.5中16种多环芳烃进行分析,并在监测点
期刊
多环芳烃
健康风险评价
细颗粒物
Polycyclic aromatic hydrocarbonsHealth risk assessmentParticula
其他学术论文