基于MCTS-RAVE的智能博弈

来源 :江南大学学报：自然科学版 | 被引量 : 0次 | 上传用户：k854642

【摘要】

：

针对蒙特卡罗树搜索（MCTS）算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,

【作者】

：

芮雄星王一莉

【机构】

：

南京工业大学电子与信息工程学院

【出处】

：

江南大学学报：自然科学版

【发表日期】

：

2011年2期

【关键词】

：

博弈搜索蒙特卡罗树搜索快速动作值估计 gaming search MCTS RAVE

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对蒙特卡罗树搜索（MCTS）算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实例表明,该种方法较MCTS具有更高的智能表现,并有一定的实用价值。

其他文献

自密实混凝土应用发展与研究

文章从自密实混凝土的特点、配合比、性能评定、应用领域及改良技术等方面，介绍了自密实混凝土应用的发展及研究情况。

期刊

自密实混凝土配合比性能应用改良技术

淮委水利水电技术研究中心工作掠影

期刊

浅谈混凝土工程的施工技术

混凝土工程是建筑工程施工的主要工程之一，是现代工程建设中应用最广的建筑材料之一。混凝土无论在技术上或经济效果上都具有许多优点：它的组成材料，除胶结材料外，都是廉价的砂石

期刊

混凝土工程施工技术建筑工程施工经济效果建筑材料现代工程组成材料胶结材料

嶂山闸除险加固工程通过水下工程阶段验收

“嶂山闸是骆马湖泄洪控制口门，水利部以水总[2004]507号文批复嶂山闸除险加固工程初步设计。批复总工期2．5年。工程自2006年11月1日正式开工，经过各参建单位的共同努力，目前水下

期刊

除险加固工程水下工程嶂山闸骆马湖水利部总工期批复泄洪

鲁口孜泵站穿堤涵地基沉降量计算及分析

本文对影响鲁口孜泵站穿堤涵地基沉降量的诸多因素进行分析，详述了计算过程中具体简化的方法，并通过实测数值验证计算结果。

期刊

穿堤涵地基应力最终沉降量

轻载型轴流泵的流场分析和叶型优化

在不同工况下，采用商业软件Numeca的Fine／Turbo模块，对包含叶轮、导叶、弯管、喇叭管的轻载型轴流泵进行了全流道的三维湍流数值模拟计算，并在与已有试验数据进行了较好吻合的基

期刊

移动泵站轴流泵流场模拟叶型优化Numeca软件mobile station axial flow pump flow field simulati

时变耦合网络的完全同步

研究了时变耦合网络的完全同步问题。针对时变耦合复杂网络提出了一个新的同步方案;并用LaSalle不变性原理,证明了在不需要知道同步轨迹的前提下,就能实现该复杂网络的同步。

期刊

复杂网络完全同步时变网络耦合强度complex networks complete synchronization time-varying net

基于MCGS的称重控制器驱动程序设计

研究了MCGS组态软件与特殊设备之间的驱动问题。根据MCGS提供的接口规范,利用VB6.0进行驱动程序开发。以基于C8051F060单片机为处理器的称重控制器为研究对象,详细阐述了利用

期刊

驱动程序通信协议MCGS组态软件driver communication protocol MCGS configuration software

桥接网络模式下多虚拟机初始参数冲突的解决方法

针对网络对拷后在桥接网络模式下多虚拟机之间的MAC地址冲突及计算机重名问题,提出了虚拟机初始参数的自动配置方法（VPIAAC）。该方法预先定义了宿主主机与虚拟机系统初始参数的

期刊

虚拟机MAC冲突计算机重名virtual machine MAC conflict same compute name

基于位置加权粒子群算法的WSNs能量优化

针对无线传感器网络经典分簇协议Leach存在能量消耗过大的问题,提出了一种基于LEACH的改进协议.该协议采用位置加权粒子群算法结合对惯性权值、学习因子的调整,优化LEACH协议

期刊

无线传感器网络粒子群算法位置加权能量优化WSNs PSO position weighted energy optimization

基于MCTS-RAVE的智能博弈

与本文相关的学术论文