多agent协同强化学习算法SE—MACOL及其应用

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:guozhi1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多agent团队中各成员之间是协作关系且自主决策的学习模型,在此对Q学习算法进行了适当扩充,提出了适合于多agent团队的一种共享经验元组的多agent协同强化学习算法。其中采用新的状态行为的知识表示方法,采用相似性变换和经验元组的共享,能够提高多agent团队协同工作的效率。最后将该算法应用于猎人捕物问题域,实验结果表明该算法能够明显加快多个猎人合作抓捕猎物的进程。
其他文献
目的探讨Stathmin在非小细胞肺癌发生、发展中的作用。方法采用RT—PCR法检测50份非小细胞肺癌组织及相应癌旁组织、正常肺组织标本中Stathmin的表达情况,分析Stathmin表达与
血小板增多症是一种临床上经常遇到的以血小板计数增多,有出血倾向及血栓形成风险等为特点的疾病,多是偶然发现。虽然血小板增多症均有血小板计数增高,但是由于血小板增多症病因
患者男,13岁,因“头晕4a,癫痫发作2a,脾气暴躁等性格改变3个月、加重1个月”人院。患者于4a前无明显诱因出现头晕,在当地医院检查后以“脑炎”收入院,期间行抗炎及对症治疗,症状减轻
目的探讨贝那普利、替米沙坦对体外原代培养的人网膜和皮下来源的前脂肪细胞脂联素(APN)表达的影响。方法自12例行电切开腹部手术的健康成年女性腹部皮下和网膜分离前脂肪细胞,
在《大学化学实验》中引入12个微型化学实验,使大学化学实验在整体改革中显示出独特的魅力,微型化学实验贯穿在基础部分、结合部分、应用与开放部分,使课程在方法与手段上新颖化
患者女,73岁,主因“头痛20余天”于2011年10月收入院。20余天前发病后曾到当地县医院行脑CT检查,诊断为“蛛网膜下腔出血”并给予相关治疗(具体不详),头痛稍缓解,饮水偶有呛咳。为求
研究在石灰性烂Ban田中冬种紫云英对土壤酶活性的效应。结果表明:石灰性烂Ban田冬种紫云英能显著地增加土壤有机质和土壤氮、磷含量,对土壤脲酶、尿白酶、转化酶活性的提高也有显著的
烟雾病(Moyamoya disease,MMD)于1957年由Takeuchi和Shimizui首次描述,以双侧颈内动脉末端和大脑前、中动脉近端狭窄或闭塞为特点,有时也累及大脑后动脉^[1]。该病因伴随脑底异常
广西地质发展史约从8亿年前的晚元古代开始,当时仅有海生的类植物区系繁衍于广西深海-半深海海域中,陆地植被的兴起已到了志留纪末,出现于云开大山,西大明山-大瑶山隆起的近海湿润地
患者女,63岁。因右侧胸痛2周,喘憋3d于2012年2月8日入院。既往有高血压病史。查体:体温36.8℃脉搏114次/min,呼吸23次/rain,血压133/89mmHg,喘憋貌,口唇发绀,被迫坐位,右下肺叩诊浊音,听诊