Multi-Agent交互机制与学习策略研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wsx19781029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对Agent的基本理论、学习机理、交互机制等进行了较深入的研究,构建了基于Agent的虚拟企业联盟系统。本文的主要研究内容如下: 1.在系统分析现有研究成果的基础上,明确界定了Agent的内涵,从微观角度对几种Agent内部结构类型作了分析与比较,从宏观角度阐明了Agent组织的结构、形成及演化。此外还阐释了Agent思维状态的要素、模型以及Multi-Agent联合思维状态。 2.分析了协作、协调、协商等Agent交互手段,重点讨论了合同网协议、黑板模型,对协商过程、协商模型进行了详细的分析。在此基础上建立了基于合同网的合作联盟模型,对联盟的管理和运作进行了较为深入的研究。 3.从学习的一般性概念入手,研究了学习的信息加工模型以及学习的系统模型,阐释了几类主要的机器学习策略。对强化学习进行重点研究,详细地分析了强化学习的原理,并在Agent个体强化学习算法的基础上,研究了Multi-Agent合作强化学习算法。 4.在理论研究的基础上,构建了基于Multi-Agent的虚拟企业联盟系统,并对“学习”在各个模块中的运用作了详细的分析。
其他文献
随着微电子技术的发展进入瓶颈,一些非传统计算模型的探索与研究开始引起人们更多地关注,比如量子计算、生物计算等。膜计算由G. P?aun院士受到细胞处理化学物质的机理启发而提
连续碳酸化分解过程是砂状氧化铝生产新工艺过程的关键工序,其分解率梯度与末槽分解率直接影响连续碳酸化分解过程产品的产量和质量。本文针对中州分公司连续碳酸化分解过程
由于CTI(计算机电话集成)技术的发展使呼叫中心得到广泛的应用。相比较呼叫中心实现技术的发展,对呼叫中心管理的研究显得有些滞后。而针对呼叫中心的排队模型研究更是如此。
在临床诊断治疗中,往往要求对病人的病变部位进行多次成像,以获取互补、有效、全面的信息,提高医生的诊断治疗效果,这就需要进行医学图像的信息融合,把多幅图像的信息融合在
随着机器人学在各个领域的快速发展,机器人在工业,军事以及人们的日常生活等方面的应用越来越显著。目前大部分机器人的控制都是需要定位信息的。然而对于在某些极端环境下,如洞
Affinity propagation(A P)算法是一种高效率的聚类算法。其运行时间比典型的k-中心聚类算法要少得多,聚类效果也显著提高。但是AP算法是一种无监督学习的聚类算法,它的缺点是
近年来,网络化控制系统作为控制领域的研究热点,得到了大量学者的关注并取得了相当丰富的研究成果。随着科学技术的发展和工业控制需求的增长,如何实现更高精度、更高效率以及更
伴随着海上贸易的快速发展,海上船舶的数量不断增长,船舶间发生碰撞的事故也变的越来越多。如何制定出有效的方法来减少船舶间事故发生的数量,一直是船舶领域热门的研究方向
超声波电机作为一种新型电机,由于电机特性的不同,其测试技术不同于已发展成熟的电磁电机的测试技术。因此,探索适合超声波电机的测试技术,构建一个超声波电机的自动测试系统,以测试、研究和分析超声波电机的特性,对超声波电机的原理及其控制器的研究有着重要意义。 本文对超声波电机测试技术及其实现方法进行了探索与研究,基于实验室现有设备构建了超声波电机的自动测试系统,对系统上下位机的软件进行了设计与开发,
本文针对三维地质建模及可视化研究发展现状,在系统分析当前各种建模方法,并综合计算机辅助设计、科学计算可视化、计算机图形学、地质学等学科理论的基础上,提出了表面、体