基于核密度估计的分层强化学习自动分层算法

来源 :自动化技术与应用 | 被引量 : 0次 | 上传用户:wwtmw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分层强化学习中自动分层问题目前仍未得到有效的解决,本文针对Option方法,研究了基于核密度估计的Option自动生成算法,该算法根据分层强化学习的特点并结合改进后的核密度估计层次聚类方法,实现分层强化学习的自动分层,生成子目标,并在此基础上构建出Options。实验结果表明这种算法可以大大加快学习的效率。
其他文献
目的探讨护士给药错误发生原因,制定防范对策,确保病人用药安全。方法回顾分析护士发生的49例给药错误不良事件。结果针对给药错误原因制定了包括个人和系统方面的集束化防范
典型的非正交多址接入技术(Non-orthogonal Multiple Access,NOMA)有稀疏码分(Sparse Code Multiple Access,SCMA)、多用户共享(Multi-user Shared Access,MUSA)、图样分割(P
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的:探讨检测血清白蛋白(ALB)、胆碱酯酶(CHE)、凝血酶原活动度(PTA)对病毒性肝炎肝硬化患者的临床意义。方法:选择2018年2月~2019年4月于我院就诊的病毒性肝炎肝硬化患者65
目的:探讨抗HCV抗体筛查试验假阳性问题及解决方案,分析本地区HCV感染实际情况,确立适合本实验室的丙型肝炎病毒检测的临床路径。方法:收集2018年1月~2019年10月抗HCV抗体检
习近平人民观,是党的十八大以来以习近平同志为核心的党中央在治国理政过程中形成的重要思想。在第十八届中央委员会第五次全体会议上习近平总书记首次提出了“以人民为中心”的工作导向,新时代,与人民息息相关的重要任务的完成都需要有一个正确的科学理论作指导,在此背景下,习近平人民观为完成这些奋斗目标提供了重要的思想理论基础。文章主干包括五个部分:第一部分是习近平人民观的理论来源和现实依据,考察了其历史形成因素
为了解杨梅Myricarubra不同种质花期和雌花性状差异,采用形态学观测方法,对国家杨梅种质资源圃保存的49份杨梅种质资源进行花期和雌花花序性状的调查和多样性分析。结果表明: