多Agent协作的强化学习模型和算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:haohade
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并做出相应的决策,进而达成最优的联合动作策略。最后,通过对猎人。猎物追逐问题的仿真试验验证了该算法的收敛性,表明这种学习算法是一种高效、快速的学习方法。
其他文献
从1985年11月起用系谱选育方法培育了A、B二个品系,两系体型外貌均趋一致,具有本地三黄鸡的特色。A系以提高产肉能力为主,B系以产蛋能力为主。两系的一代杂种供作肉鸡饲养。
临床试验探索和确证对目标适应病证咳嗽患儿的治疗及辅助治疗作用。试验设计采用随机、双盲对照、多中心的方法,明确小儿咳嗽诊断,并严格纳入排除标准。以改善咳嗽、咯痰症状
韩国语教学安排和教学过程要统一于总的培养目标.通过全面教学活动的把握,培养具有听、说、读、写、译综合能力的实用人才.
白酒是我国传统的消费品,利税高,国民经济有较大贡献,中国白酒业正处于生命成熟期的中后期,面临总市场需求趋向饱和、产品价格走低、进入国际市场困难等诸多问题。我国的白酒
随着国家的强大,社会经济得到了逐步的完善和发展,我国的城市化进程也有了很大的发展。同时市政道路桥梁的发展和百姓对施工质量要求也得到了提高,因为它本身的施工技巧很是
地理学科是高中教学中的重要学科之一,特别是对于文科生来说,地理在日常学习及高考中占据着重要的地位,在进行高中地理学习的过程中,因为其中的知识结构较为复杂,经常需要在
目的探讨不良孕产史夫妇染色体异常核型检出率及其分布,以及染色体异常核型与不良孕产史的关系,为优生优育及遗传咨询提供理论依据。方法选取2016年1月1日至2017年12月31日,
图书馆阅览空间中越来越多地出现电子阅读媒体的使用,而针对电子阅读媒体特点的照明环境设计要求尚未明确。本文选取京津地区共6个大型公共图书馆和高校图书馆,针对馆内阅览
时值我校新旧图书馆的交替,花溪新校区临时图书馆的工作是一项复杂而又系统的工程,其新的管理、布局和设备的运用,把图书馆的工作提高到一个崭新的层面:图书馆对图书实行开架
目的探讨静脉留置针软管在外伤性泪小管断裂吻合术中应用的临床效果。方法16例(16眼)患者外伤性下泪小管断裂吻合术中用静脉留置针软管作为支撑物,置管保留3个月后拔出,拔管后