A Reinforcement Learning System to Dynamic Movement and Multi-Layer Environments

来源 :智能学习系统与应用(英文) | 被引量 : 0次 | 上传用户:bluesnail2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
There are many proposed policy-improving systems of Reinforcement Learning (RL) agents which are effective in quickly adapting to environmental change by using many statistical methods, such as mixture model of Bayesian Networks, Mixture Probability and C
其他文献
本文以盘锦市科技信息资源开发利用中存在的问题为切八点,提出了如何加强盘锦科技信息资源的开发和利用,以便更好地服务地方经济发展。
中国诗歌从遥远的商周到晚清始终是一部以格律诗为主体的发展史.由于新诗诞生之日正值世界性的非格律化倾向泛滥之时,加之早期的新诗创造者们对传统文化持一种偏激的否定心态
新版的国家计量技术规范JJF1069—2007《法定计量检定机构考核规范》由国家质检总局于2007年2月28日发布,从2007年4月1日起实施。为了便于各级法定计量检定机构及时了解和贯彻
开闭所直流在线管理系统项目的实施,为运行人员提供了一个能够随时获取蓄电池组等设备运行状态的强大工具,例如以往只能通过看、听、摸或用万用表逐缸测量电压的手段来对蓄电池
Technological advances and the enormous flood of papers have motivated many researchers and companies to innovate new technologies. In particular, handwriting r
【正】 在鲁迅的全部著作中,《野草》是独具一格的作品,与作者的绝大多数现实主义著作迥然不同,这部散文诗集广泛采用了象征主义表现手法,抒情喻理,十分隐晦曲折。 鲁迅为什
This paper proposes a method for determining the stabilizing parameter regions for general delay control systems based on randomized sampling. A delay control s
为了保障煤矿安全生产,降低事故的发生.我国不少煤矿安装了瓦斯监控系统,全方位对煤矿井下瓦斯进行不间断的检测。采用的瓦斯检测仪器主要包括甲烷传感器、便携式甲烷检测报警仪
本栏目创办以来,受到广大青年同志的欢迎,许多读者来信要求我们多刊载一些探讨艺术技巧问题的文章,以帮助青年写作者掌握写作技巧和提高创作水平。本期,我们刊登了蒋守谦同志
符号学的观点认为,文学是一种语言结构,语言是文学的直接现实,因而文学的本体是语言。语言不是媒介,不是载体,它本身就生成意义。写小说不是写生活,而是写语言。老舍在谈到文学语言