基于互信息的智能博弈对抗分层强化学习研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:LYXTTKX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能博弈在当前人工智能的发展中是较为热点的一个问题,同时随着人工智能的不断发展,在作战指挥领域也逐渐得到了广泛的应用,尤其以美国DAPPA为首,利用人工智能来为指挥员的战场决策提供全方位的策略支持,如何利用人工智能模拟战场环境下进行战场对抗也是研究的一方面。当前智能体虽然能够通过获得奖励不断进行优化,在策略上通常是根据即时奖励选择当时收益最大的策略,现实战场环境中有些决策当时虽不会有即时收益,但之后是会对整体的战场形势有更好的推动作用,能够取得更有利的战果。针对此问题,利用分层强化学习进行智能体的智能博弈训练,并应用于简单战场环境下来模拟虚拟指挥员,提出了一种基于互信息的智能博弈对抗的分层强化学习算法MI-A3C。MI-A3C算法在模拟的战场环境中能够取得86.7%的胜率,并能够完成主要任务,同时在实验中可以发现一些有利于长远收益的决策。
其他文献
本研究对学校的阅读课程现状进行调查分析,针对原有阅读课程无法满足学生阅读需求的问题,从内容、实施、评价三个方面进行了儿童整本书阅读课程的优化。内容优化是指书目(精读)的选择主要锁定在部编教材“快乐读书吧”的推荐书目及教育部基础教育课程教材发展中心中小学生阅读指导书目(2020年版);实施优化是指将阅读课程原有的四种课型(淘精读美、乐品思美、善悟得美、传承誉美)重构为导读课、推进课、整合课。评价优化
有验潮模式的水深测量可以获取高精度的水位数据,但验潮仪易丢失、破坏,会导致验潮数据丢失或不可用,造成极大的经济损失和时间成本。GPS-RTK无验潮模式水深测量可实时获取水面高程值,可避免因无水位数据导致的测量工作失效和经济损失。在GPS-RTK有效工作范围内的水深测量,可采用这两种测量模式同步进行,当验潮仪受到破坏时则采用无验潮的测量结果,既避免了经济损失又能按时提交测量数据。本文以国外某河道项目
实现大学生心理健康教育的创新与发展,既是当代培养可靠社会需求人才的现实需要,亦是让高校心理健康教育提质提量的必经阶段。尽管近些年对应研究与应用进展顺利,取得成效颇为显著,但深挖之下发现仍存在模式创新不足、成效显性不足、服务质量不高、体系建设不全、平台建设不完善的现实难题。为此,本文从基于课程建设,实现教学模式的三位一体构建;基于品牌活动,实现积极心理文化氛围的营造;基于疏导帮扶,实现心理咨询服务体
<正>在我国非洲猪瘟疫情还未彻底消除、疫苗无法有效防控的背景下,养猪场规模化消毒剂的选择和消毒程序的实施是最有力的防控武器。从笔者了解到的养猪场来看,绝大部分养猪场都配备消毒装置,但养猪场使用的消毒程序和消毒剂有明显区别,在实际工作中,消毒操作包括出猪后消毒以及带猪消毒。此外,
期刊
<正>在社会经济不断发展的过程中,档案管理发挥着越来越重要的参考作用。大数据技术已经被广泛应用到社会各个领域,在档案管理工作中也起到重要作用,不仅使档案管理工作效率得到了进一步提升,也使档案管理模式实现了创新发展,档案的储存质量和利用效率都得到了明显的提高。一、大数据时代背景下档案管理的主要特点随着大数据技术的广泛应用,人们的生产生活也发生了极大的改变,尤其是大数据拥有着强大的存储容量,能够自动获
期刊
<正>课题来源简介道德法律与心理健康教育对于大学生的成长有着十分重要的价值,大学生正处于世界观和价值观完善阶段,大学阶段也是学生成长的重要时期,在这一时期需要关注大学生的心理健康发展状况。大学阶段学生可能面临着各种各样的问题、比如社交问题,学习以及日常生活中所存在的问题,这可能会使学生产生一定的压力,针对学生进行道德法律与心理健康教育,能够帮助缓解压力,提供精神动力。与此同时,道德法律相关教育也能
期刊
近年来,大数据分析在审计中的应用越来越广泛,本文以油田企业为例,分析了开展大数据审计面临的挑战、发展的方向,在此基础上提出利用“万物皆联”大数据分析法,深入油田生产经营最前端,探索专业性更强、覆盖面更广的专项审计,堵住影响企业效益增长的风险点,发挥内部审计的预警、实时监控作用,实现真正意义上的大数据审计。
人类文明历程包括原始文明、农业文明、工业文明和生态文明。生态文明融入四大领域(经济、政治、文化、社会),在党的十八大报告中,生态文明建设已上升为党的执政方针。人与自然和谐相处是人类社会可持续发展的基本要求,而生态文明建设则是促进人与自然和谐相处的重要路径。文章基于此,分析了以生态文明建设促进人与自然和谐相处的意义,包括促进社会经济的永续发展、提高人的生活质量、扭转环境污染加剧的态势,继而从生态保护
文中以所在深水基槽项目为例,介绍了基于T50P多波束测深系统的RTK无验潮测量方法的原理,系统组成与作业流程,并对成果数据精度对比分析,证明了该方法在实际测量中的优势与可行性。