A Reinforcement Learning System to Dynamic Movement and Multi-Layer Environments

来源 :智能学习系统与应用(英文) | 被引量 : 0次 | 上传用户：bluesnail2002

【摘要】

：

There are many proposed policy-improving systems of Reinforcement Learning (RL) agents which are effective in quickly adapting to environmental change by using

【作者】

：

Uthai Phommasak Daisuke Kitako

【机构】

：

DivisionofInformationandElectronicEngineering,DepartmentofInformationEngineering

【出处】

：

智能学习系统与应用(英文)

【发表日期】

：

2014年4期

【关键词】

：

REINFORCEMENT Learning PROFIT-SHARING Method MIXTURE PROBABILITY CLUSTERING Rein

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

There are many proposed policy-improving systems of Reinforcement Learning (RL) agents which are effective in quickly adapting to environmental change by using many statistical methods, such as mixture model of Bayesian Networks, Mixture Probability and C

其他文献

对盘锦科技信息资源开发和利用的思考

本文以盘锦市科技信息资源开发利用中存在的问题为切八点，提出了如何加强盘锦科技信息资源的开发和利用，以便更好地服务地方经济发展。

期刊

科技信息资源信息资源共享开发利用

评万龙生的诗歌创作

中国诗歌从遥远的商周到晚清始终是一部以格律诗为主体的发展史.由于新诗诞生之日正值世界性的非格律化倾向泛滥之时,加之早期的新诗创造者们对传统文化持一种偏激的否定心态

期刊

万龙生诗歌格律艺术风格生活体验语言

新版《法定计量检定机构考核规范》简介

新版的国家计量技术规范JJF1069—2007《法定计量检定机构考核规范》由国家质检总局于2007年2月28日发布，从2007年4月1日起实施。为了便于各级法定计量检定机构及时了解和贯彻

期刊

法定计量检定机构考核规范国家质检总局计量技术规范规范修订修订原则

开闭所直流在线管理系统开发应用

开闭所直流在线管理系统项目的实施，为运行人员提供了一个能够随时获取蓄电池组等设备运行状态的强大工具，例如以往只能通过看、听、摸或用万用表逐缸测量电压的手段来对蓄电池

期刊

直流设备管理计划检修技术特点新技术特点

A Comparison of Neural Classifiers for Graffiti Recognition

Technological advances and the enormous flood of papers have motivated many researchers and companies to innovate new technologies. In particular, handwriting r

期刊

HANDWRITINGRECOGNITIONNEURALNETWORKSNetworkSTRUCTURESHandwriting Recogniti

《野草》研究中的一个问题——释“难于直说”及其它

【正】在鲁迅的全部著作中,《野草》是独具一格的作品,与作者的绝大多数现实主义著作迥然不同,这部散文诗集广泛采用了象征主义表现手法,抒情喻理,十分隐晦曲折。鲁迅为什

期刊

鲁迅《野草》研究象征主义杂文文学革命鲁迅思想表现手法散文诗思想感情矛盾心理

Randomized Algorithm for Determining Stabilizing Parameter Regions for General Delay Control Systems

This paper proposes a method for determining the stabilizing parameter regions for general delay control systems based on randomized sampling. A delay control s

期刊

StabilizingPARAMETERREGIONSDelayControlSystemsRANDOMIZEDSamplingLMIStab

瓦斯检测仪器在安全生产中的作用

为了保障煤矿安全生产，降低事故的发生．我国不少煤矿安装了瓦斯监控系统，全方位对煤矿井下瓦斯进行不间断的检测。采用的瓦斯检测仪器主要包括甲烷传感器、便携式甲烷检测报警仪

期刊

瓦斯监控系统煤矿安全生产检测仪器甲烷检测报警仪甲烷传感器工作原理甲烷浓度甲烷检测仪

漫谈小说艺术结构的几个问题(上)

本栏目创办以来,受到广大青年同志的欢迎,许多读者来信要求我们多刊载一些探讨艺术技巧问题的文章,以帮助青年写作者掌握写作技巧和提高创作水平。本期,我们刊登了蒋守谦同志

期刊

小说结构作品主题《复活》托尔斯泰玛丝洛娃小说艺术作家艺术结构《夜的眼》王蒙

《水与火的缠绵》的语言审美特性谫议

符号学的观点认为，文学是一种语言结构，语言是文学的直接现实，因而文学的本体是语言。语言不是媒介，不是载体，它本身就生成意义。写小说不是写生活，而是写语言。老舍在谈到文学语言

期刊

语言结构《水与火的缠绵》审美特性文学语言池莉作品风格语言形式新写实主义

A Reinforcement Learning System to Dynamic Movement and Multi-Layer Environments

与本文相关的学术论文