【摘 要】
:
博弈论(Game theory)是研究竞争条件下决策分析的科学。它研究的典型问题是若干个利益冲突者在同一环境中进行决策以求自己的利益得到满足。近年来,博弈理论模型已经在计算机
论文部分内容阅读
博弈论(Game theory)是研究竞争条件下决策分析的科学。它研究的典型问题是若干个利益冲突者在同一环境中进行决策以求自己的利益得到满足。近年来,博弈理论模型已经在计算机科学和人工智能领域产生了深远的影响。尤其是在多Agents领域,很多学者作出了大量工作,其方向主要集中在:博弈模型研究、博弈算法研究等。行为图博弈模型是一种新型的博弈模型。它涵盖已有的结构化博弈模型,图型博弈,阻塞博弈和局部效用博弈。求解Nash均衡是行为图博弈模型的核心问题。本文重点研究行为图博弈模型上从效用函数到Nash均衡求解的相关问题。首先,在本文中我们详细分析了博弈中Agent的有关问题,简要介绍了规范型博弈,具有结构化博弈模型的图型博弈,以及阻塞博弈和局部效用博弈。并且分析了当前一些学者们提出的算法。然后着重考察了行为图博弈,在行为图博弈中求解期望收益是通过动态规划来完成的,分析了如何在行为图博弈中求期望收益。我们把连续方法应用到行为图博弈中,我们不仅给出如何在行为图博弈中进行扰动操作、回溯、效用雅克比的计算及其消除累积错误,而且,更新混合策略剖面将其应用到下一次迭代中。紧接着分析了如何在行为图博弈中求解Nash均衡。我们用基GameTracer的规范型博弈求解期望收益,和本算法进行比较。用动态规划求行为图博弈的存储数目,给出了一个五乘五的博弈来进行实验。证明行为图博弈成多项式增长,而规范型博弈成指数增长。其次,我们通过两个实验来验证本算法的有效性,通过固定行、改变列以及固定列、改变行来进行实验。最后,运用IPA作为快速启动,利用全局牛顿算法求解Nash均衡的CPU利用时间。实验结果表明本文算法是令人满意的。
其他文献
随着无线通信技术的发展和当前无线应用的不断拓展,正如文献[1][2][3]所述,频谱资源的缺乏已成为无线应用研究过程中不得不面临的问题。然而,一些研究结果表明,目前大量的珍
论文在研究基于SOAP的Web服务安全通信机制的基础上,设计实现了XML加密组件、XML签名组件和访问控制组件。通过把这些独立的安全组件在Axis中集成实现,提高了Web服务通信的安
近二十年来,分布式拒绝服务攻击(DDoS)一直是网络安全的一个关键威胁。第一次DDoS攻击出现于1995到1996年间,它通过SYN标识的TCP包洪泛来淹没网络设备和服务器的网络通信并严
伴随着网络技术的迅猛发展,伴随着“互联网+”的概念的提出,网络上涌现出了大量的图像,人们也期待能够从这些海量的图像中快速找寻到自己需要的图像。由于目前的图像检索系统
在现代的多处理器芯片中,由恶意攻击和系统错误引发的软错误现象越来越常见,尤其对云存储服务器中的大型、多层缓存系统而言更是如此。在此背景下,如何提升数据可靠性已经成
针对现有的运动目标检测与跟踪方法在动态场景中效果不佳的情况,以足球视频中运动员的检测与跟踪为研究对象,论文在现有算法理论的基础上,改进了相关算法实现对球员的检测与跟踪
电子政务是以计算机网络技术为基础,以共享、交流、协作为核心,以政务信息流、工作流相对集成为结构的政务管理模式。通过信息资源的配置和工作流的重组,使政府工作效率更高,
语音识别技术作为信息社会朝着智能化和自动化方向发展的关键技术之一,具有重要的研究意义和实用价值。经过近五十年的艰苦探索和研究,语音识别技术研究获得了极大的发展,其中有
随着信息技术的发展,越来越多的企业采用信息系统为它们的工作服务,为了满足不同企业对同类系统的需要,例如绩效考核管理系统,系统必须具备良好的跨数据库功能。Hibernate是
随着现代通信技术、Internet以及计算机技术的飞速发展,使得基于IP网络的视频会议系统H.323已经被越来越广泛的使用,而同时随着视频编码标准的不断更新,其优势已经越来越为人