协同进化FNN在计算机围棋中的研究与应用

来源 :安徽大学 | 被引量 : 0次 | 上传用户:weilanqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机博弈(Machine Game)一直以来都是检验人工智能发展水平的试金石,以研究计算机博弈为切入点,可以充分提高各种人工智能的理论水平。  以目前计算机博弈程序的发展水平来看,大部分的博弈游戏,例如跳棋,中国象棋,五子棋等,依靠传统的博弈树搜索算法和越来越快的计算机处理速度,博弈程序的水平已经达到了专家级的高度,然而对于围棋来说,这方面的研究仍然没有突破性的进展。究其原因,是需要考虑的分支数太多,即使计算机的速度再快,也难以穷尽所有分支,目前较为主流的做法是建立一个围棋模式数据库,将当前的棋局同数据库中的模式进行匹配,以找到最佳的着法。这种做法的局限性在于需要众多的先验知识去建立该数据库,算法的好坏更多的取决于先验知识的好坏,从研究人工智能的角度来讲,我们更希望建立一个能从相互博弈的过程中不断进行自主学习的算法模型。想达到该目的只有用神经网络设计局面评估函数,目前应用到围棋上做的最好的就是SANE(Symbiotic Adaptive Neuro-Evolution)算法,在SANE算法的基础上,本文提出了一个用神经网络集成进行局面估值的围棋博弈算法模型,试验证明,该模型经过训练后具有更高的智力水平。  本文首先对相关领域知识进行了全面综述,再建立这一算法模型,并用实验验证了该算法的有效性,其中主要的创新性内容如下:  1.集成多个神经网络作为计算机围棋的局面评估函数,使用协同进化遗传算法同时优化单个神经网络以及神经网络之间的组合方式,这样更有助于在进化中保留有用部分,拓展了搜索的空间,得到对当前棋盘局面更加精准的估值。  2.计算个体适应度时,建立一个合适的多目标评价函数,而不是仅仅以比赛输赢的结果作为评价的唯一因素,这样有助于保持群体中个体的多样性,避免算法的提前收敛。  3.在博弈个体的训练上,采用自主学习和监督学习两种相结合的方式。自主学习是指个体之间相互进行博弈比赛,以比赛的结果作为评价个体适应度的一部分考虑因素。监督学习是为了防止个体之间出现相互串联作弊,因此引入多个已有的具有不同风格和棋力的计算机围棋软件,与它们进行循环赛,以比赛的结果作为评价个体适应度的另外一部分考虑因素。
其他文献
密码学作为信息保护的手段,最早应用在军事和外交领域,随科技的发展逐渐进入人们的生活中。传统的对密码协议的建模和分析主要包括:代数模型,逻辑模型,逻辑和代数模型,代数和
在应答一个来自用户的查询(query)时,现代搜索引擎会返回给用户前k个相关的查询结果及其摘要。摘要是一小段摘选于文档的文本,该段文本归纳了查询词与文档的相关关系。生成摘
可验证的秘密分享是现代密码学重要的工具之一,自从它被提出来以后,有很多的学者对它进行了广泛的研究,并且提出了许多安全高效的VSS方案,现在可验证秘密分享方案在安全多方
伴随企业生产和个人用户活动产生的大规模数据集,如何从这些数据中分析提取出有价值、有意义的信息得到了人们越来越多的重视。但目前的一些数据分析平台,一方面需要具有专业数
随着无线通信技术的飞速发展,移动终端已成为现代生活中必不可少的通信工具,移动终端用户电话薄的数据量随之增加,电话薄的有保障存储已成为移动终端用户电话薄管理的重要内
随着我国网络事业的发展,各企业纷纷建立自己的信息发布系统作为本企业对外宣传的工具。传统的企业信息发布系统从开发效率、发布速度以及权限审查等方面都不能很好地满足企
基于Web标准的设计与开发是Web标准设计开发的未来趋势,Web标准理论相对较新,目前国内的研究和应用相对匮乏,伴随着搜索引擎优化要求的不断升级,如何将Web标准应用于大型网络
近些年来,随着移动智能设备的迅速普及与发展,国际上许多学术机构开始致力于移动网络的研究,尤其是移动自组织网络。移动自组织网络(Mobile Ad Hoc Networks,MANETs)作为移动网络的
作为一种新兴技术,无线传感器网络(Wireless Sensor Network, WSN)在近几年内发展迅速,被广泛应用于环境监测、交通控制、智能房屋、情报搜集等生产、生活、国防各个重要领域
本文讨论了多源数据融合中的目标识别技术,包括辐射源识别和平台识别。针对雷达辐射源识别,本文提出了人工神经网络,模板/模糊匹配方法和D-S证据理论结合起来的雷达型号三级识别