论文部分内容阅读
在多agent系统(multi-agentsystems,MAS)中,由于单个agent自身能力和资源有限,agent间需要组成联盟并通过交互和协同工作来求解许多复杂的任务,因此联盟机制是MAS中的一个重要研究课题。前人的工作大多局限于单任务联盟或多任务联盟串行生成的研究,而且局限于一个agent只能加入一个联盟,这在很多应用场合不能满足实际系统的需要。
基于上述背景,本文针对多个任务需要同时求解的环境提出“并行联盟”的概念,从并行联盟的生成、形成和评价三个方面进行研究,力图实现多任务的并行求解,并尝试实现一个agent可以同时加入多个联盟,从而能在一定程度上提高系统的任务求解效率和资源利用率,为解决分布式智能控制系统中的复杂控制问题提供理论指导和方法依据。
本文的主要内容及创新之处如下:
(1)提出一种基于免疫的多任务联盟并行生成算法。首先设计一种基于维数的agent能力划分策略,提出“子agent”概念,并在此基础上提出一种基于三维二进制编码和疫苗自适应提取策略的免疫算法来求解多任务联盟并行生成问题,使一个agent同时加入多个任务求解联盟。实验结果证明该算法的有效性。
(2)提出一种新的多任务联盟并行形成策略。首先从理论上论证多任务联盟的形成过程是一个Markov决策过程,然后基于强化学习设计单个agent的行为策略,并给出多任务联盟的并行形成过程。实例说明该策略可以在面向多任务的领域中有效地为多任务并行形成求解联盟。
(3)通过引入D-S证据理论,从agent能力强弱、协调配合的性能、通信开销、熟悉度以及可持续发展性五个指标对联盟收益进行不确定和不完全性的综合评判,提出一种双层联盟评价方法。该方法符合人的思维判断过程,具有一定的灵活性、有效性和合理性。
(4)提出一种面向自组织、自学习agent的并行多任务分配算法,首先将agent和任务随机放置在二维的网格内,在此基础上设计基于ProfitSharing学习的单agent寻找任务模型,并给出agent间的通信和协商策略以确定agent对任务的实际贡献量。
对比实验说明该算法不仅能有效地同时为每个任务寻找到求解联盟,且能明确给出各任务求解联盟中agent成员的实际承担量,更加有效和鲁棒。