基于改进DenseNet与CNN的非完备信息博弈的研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:wcyzlh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,人工智能技术发展迅速。其中,深度学习技术作为人工智能技术的一个重要分支广泛应用在图像识别、物体检测、语音识别方面。自从Google团队把深度学习应用到完备信息博弈游戏围棋中,并取得了巨大的成功之后,把深度学习技术应用到博弈上的研究开始越来越多。传统的解决非完备信息博弈的方法主要有强化学习,搜索等方式来解决。强化学习的方法对于有巨大动作空间的问题来讲,需要维护一个巨大动作-价值表,这样对于很多问题来讲维护表很困难,对计算机的计算能力要求也很高。搜索的方式在对问题进行建模的时候也会由于动作空间的巨大需要创建巨大的搜索树,对于小型动作空间的完备信息博弈游戏尚可。但是碰到巨大状态动作空间的问题局限性很大。本课题以非完备信息博弈游戏作为研究对象,针对传统解决非完备信息博弈方法的局限性,利用深度学习方法的强大特征提取能力直接用端对端的方式来解决麻将游戏中的决策问题。本文内容主要有以下几个部分组成,每个部分也分别代表本课题中我所在做的工作简要概述。1、设计一种用来描述非完备信息博弈游戏场面博弈信息的三维矩阵,其中通道数表示每一种影响决策因素。对于本课题所用的训练数据集是来自游戏公司的游戏玩家对战日志信息。对于对战日志信息的处理包括积分排名、数据筛选、数据抽取等一系列数据处理操作,使得训练集数据可以满足神经网络模型的输入数据结构要求,即从对战日志信息格式转化为三维矩阵格式。通过采用上述的数据构造方法,不但可以有效减少传统利用构建博弈树的方法来解决决策问题的计算量,而且采用深度学习的方法在推广到其它的决策问题上也更简单方便。2、设计一种基于改进的DenseNet的麻将出牌决策模型和改进的CNN网动作网络模型。考虑到深度神经网络模型由于模型深度的增加存在的梯度消失、过拟合等问题。本课题在DenseNet网络模型中引入Squeeze Net网络模型的Fire模块。利用Fire模块的数据压缩功能和混合卷积核结构设计对三维矩阵数据进行多层次的特征提取,不仅降低了模型的复杂度,原始模型密集连接的方式更是有效的缓解了模型的过拟合。对于CNN网络模型,本文受Google Net网络模型启发,把Inception结构结构结合残差网络的跳层思想对CNN模型进行改进。我们将改进后的DenseNet网络模型和改进后的CNN网络模型在相同的数据集上进行训练测试。通过和经典的机器学习模型和深度学习模型进行精确度的对比,改进的模型可以实现精确度的提升,初步达到实验目的。
其他文献
随着经济的发展以及互联网技术的普及,传统零售行业受到了一定冲击,于此同时电商行业红利也在逐渐消失,发展进入了瓶颈期,特别是随着消费主力军80后,90后对消费体验要求越来越高,不再仅仅追求价格的实惠,传统零售行业以及电商正在寻求一种新的商业模式,顺应时代以及客户多方面的需求,在这种背景下,线上+线下+物流的新零售模式应运而生,这种模式将线上购物的便捷性和线下购物的体验感结合起来,同时配合数字化企业管
知识经济时代,高等教育日益成为国家和社会发展的核心竞争力,是不可或缺的源动力。高等教育发展区域差异问题一直是学术界研究的热点问题,区域高等教育发展水平的不均衡,会引起区域经济发展的不均衡,深刻影响着经济社会的可持续发展。因此客观评价我国区域高等教育发展水平,分析高等教育发展的时空演变规律,揭示影响高等教育区域差异时空演变的动力机制,对于提升我国高等教育发展水平,推动高等教育均衡发展,促进经济社会全
“十四五”到来,是开启乘势而上全面乡村振兴的新征程。要实现第二个百年奋斗目标民族复兴,乡村就必振兴。这其中,难点重点依然是“三农”,要构建新发展格局,潜力后劲也在“三农”,要解决新阶段“三农”问题,就迫切需要培育乡村产业发展新动能。2020年5月江西省政府发布《关于促进乡村产业振兴的实施意见》通过做大优势主导产业、做精乡村特色产业、做强农产品加工业、做实乡村新型服务业,助力全省乡村产业振兴,202
传感器是电网中各种信息量的探测终端,是电力调度、监测控制、在线监测、互联通讯的基础设施单元,为电网的稳定运行提供了可靠的保障。然而,随着智能电网的发展,电网对传感器性能要求更加严格,对传感器的需求数量日趋增加,传统单一的电池供能无法满足使用需求,对传感器的运行维护难度大大增加。如何解决传感器的可靠供能,成为制约无线传感技术发展的重要因素之一。本文对现有几类环境取能方式进行了归纳,根据各种取能方式的
复合绝缘子体积小、质量轻,并且耐污闪性能优异,因而在输电线路中应用广泛。但随着运行时间的增加,其耐污闪性能不断下降,直观表现为硅橡胶伞裙憎水性能的降低,为了保证电力系统的稳定运行,需要定期检测复合绝缘子的憎水性,将严重老化的绝缘子退出电力系统的运行。常用的憎水性检测方法为喷水分级法,但传统的喷水分级法存在较强的人为主观性,为了克服这个缺点,很多学者将喷水分级法与图像处理技术相结合,提取出喷水图像中
背景和目的糖尿病视网膜病变(diabetic retinopathy,DR)已经成为导致成人非外伤性失明的主要原因。DR的病理生理机制复杂,氧化应激和炎症在其中起到重要的作用。胆红素是血红素的主要代谢产物,具有强大的氧自由基清除能力。因此,胆红素可能对DR具有重要保护作用。本研究旨在探究2型糖尿病患者血清胆红素水平和视网膜病变的相关性。方法本研究选取从2018年11月至2020年11月在南昌大学第
近年来,随着机器学习的火热发展,脑机接口研究领域也重归热门,相应的也暴露出很多问题。脑电信号的基本特点就是非线性和非平稳性,这就表明不同人的脑电信号差异巨大,在进行预处理和特征提取时,没有统一的完美的方法。鉴于此,本文针对2008年BCI CompetitionⅣ的Data sets2a数据集的9位受试者的脑电信号,提出了一种新的预处理方案。此外,本文首次引入SSA对SVM分类器进行核系数和惩罚系
地面数据处理系统需要高光谱图像的可视化,以便进行快速查看和信息测量。与多光谱图像相比,高光谱图像拥有更加丰富的信息,这为高光谱图像可视化研究提供了有利条件。传统的高光谱图像可视化算法通常存在色彩失真与细节丢失的问题,本文分析了现有算法中存在的问题,结合神经网络技术在特征提取与图像重建方面的优势,采用神经网络技术对高光谱图像可视化问题进行了建模。主要研究内容如下:1、对于传统的高光谱图像可视化任务,
无线传感器网络(Wireless Sensor Networks,WSNs)被广泛应用于各个领域,是物联网感知层重要的支撑技术之一。如何最大限度地提高其能量效率,是当前重要的研究课题。现存的WSNs能效优化研究存在以下两个问题。问题一,传统的能量收集受限于很多外部因素,缺乏稳定性,能量采集效率低下;问题二,经典路由协议在簇头选举和簇间路由选择上不合理,簇头选举未考虑节点能量,簇间多跳传输耗能严重,
联邦学习作为人工智能的一个新兴领域,能有效帮助多个边缘设备在满足用户隐私保护的要求下,协同训练共享模型,但仍然存在能耗开销重和隐私漏洞等问题。首先,边缘设备实时训练本地数据时会产生大量能源消耗,特别是当联邦学习横向扩展时,随着边缘设备数量的增加,能耗问题会进一步加重。其次,联邦学习这种协同学习行为仍可以通过模型逆推理的方式繁衍出用户隐私信息。因此,我们急需一种方法来支撑大规模机器学习并降低用户隐私