A Policy-Improving System for Adaptability to Dynamic Environments Using Mixture Probability and Clu

来源 :电脑和通信(英文) | 被引量 : 0次 | 上传用户:aqlgx123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Along with the increasing need for rescue robots in disasters such as earthquakes and tsunami, there is an urgent need to develop robotics software for learning and adapting to any environment. A reinforcement learning (RL) system that improves agents’ po
其他文献
目前.出租汽车内的各类传感器大多采用了电子元件来取代以前的机械式器件。如今.一些型式的计价器就直接采用汽车上的电子里程传感器信号作为计价器的传感器输入信号.这虽然给计
The algorithm of fingerprint constructing for still images based on weighted image structure model is proposed. The error correcting codes that are perfect in w
今年1至6月.新钢钒公司围绕生产经营目标、降本增效和节能减排等工作重点.发挥能源计量管理在企业节能降耗、提质增效中的重要作用,通过采取强化测量体系基础管理.加大能源计量监
Mobile applications affect user’s privacy based on the granted application’s permissions as attackers exploit mobile application permissions in Android and ot
本文阐述了煤矿机械设备润滑的意义和管理的基本任务,就煤矿机械设备的特点和润滑管理的要求,选用合适的润滑方式做了详细介绍。
JJG1036—2008《电子天平》检定规程(以下简称“新规程”)修订的基础是JJG98—1990《非自动天平》检定规程(以下简称“旧规程”)。旧规程包含电子天平、机械天平新生产(包括进口的
With the rapid development of integrated circuits [1], low power consumption has become a constant pursuiting goal of the designer in chip design. As the memory
研究了金属材料代码所包含的主要属性,提出了金属材料代码中的牌型号、状态、规格、等级、产品标准、生产厂和计量单位等属性的规范表示方法。
The paper made a research on the fiber Bragg grating sensor demodulation system, which was based on virtual instrument labview and it developed a friendly upper
为参加今年8月31日在石家庄举办的第十三届中国戏剧“梅花奖”颁奖活动祝贺演出,石家庄市评剧院一团全力以赴,为青年优秀演员袁淑梅赶排折子戏专场,角逐96年度“梅花奖”。时