基于行为图博弈的Nash均衡算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户：yuggmacc

【摘要】

：

博弈论(Game theory)是研究竞争条件下决策分析的科学。它研究的典型问题是若干个利益冲突者在同一环境中进行决策以求自己的利益得到满足。近年来,博弈理论模型已经在计算机

【作者】

：

李宗齐

【机构】

：

郑州大学

【出处】

：

郑州大学

【发表日期】

：

2009年期

【关键词】

：

Agent MAS 行为图博弈博弈论纳什均衡

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

博弈论(Game theory)是研究竞争条件下决策分析的科学。它研究的典型问题是若干个利益冲突者在同一环境中进行决策以求自己的利益得到满足。近年来,博弈理论模型已经在计算机科学和人工智能领域产生了深远的影响。尤其是在多Agents领域,很多学者作出了大量工作,其方向主要集中在:博弈模型研究、博弈算法研究等。行为图博弈模型是一种新型的博弈模型。它涵盖已有的结构化博弈模型,图型博弈,阻塞博弈和局部效用博弈。求解Nash均衡是行为图博弈模型的核心问题。本文重点研究行为图博弈模型上从效用函数到Nash均衡求解的相关问题。首先,在本文中我们详细分析了博弈中Agent的有关问题,简要介绍了规范型博弈,具有结构化博弈模型的图型博弈,以及阻塞博弈和局部效用博弈。并且分析了当前一些学者们提出的算法。然后着重考察了行为图博弈,在行为图博弈中求解期望收益是通过动态规划来完成的,分析了如何在行为图博弈中求期望收益。我们把连续方法应用到行为图博弈中,我们不仅给出如何在行为图博弈中进行扰动操作、回溯、效用雅克比的计算及其消除累积错误,而且,更新混合策略剖面将其应用到下一次迭代中。紧接着分析了如何在行为图博弈中求解Nash均衡。我们用基GameTracer的规范型博弈求解期望收益,和本算法进行比较。用动态规划求行为图博弈的存储数目,给出了一个五乘五的博弈来进行实验。证明行为图博弈成多项式增长,而规范型博弈成指数增长。其次,我们通过两个实验来验证本算法的有效性,通过固定行、改变列以及固定列、改变行来进行实验。最后,运用IPA作为快速启动,利用全局牛顿算法求解Nash均衡的CPU利用时间。实验结果表明本文算法是令人满意的。

其他文献

认知无线网络动态频谱分配技术研究与实现

随着无线通信技术的发展和当前无线应用的不断拓展,正如文献[1][2][3]所述,频谱资源的缺乏已成为无线应用研究过程中不得不面临的问题。然而,一些研究结果表明,目前大量的珍

学位

认知无线电(CR)中心式分布式动态信道分配自适应主用户活动性

基于SOAP的Web服务安全通信机制的研究与实现

论文在研究基于SOAP的Web服务安全通信机制的基础上,设计实现了XML加密组件、XML签名组件和访问控制组件。通过把这些独立的安全组件在Axis中集成实现,提高了Web服务通信的安

学位

Web服务简单对象访问协议XML签名XML加密基于角色的访问控制

基于节奏矩阵的AL-DDoS攻击检测技术研究

近二十年来,分布式拒绝服务攻击(DDoS)一直是网络安全的一个关键威胁。第一次DDoS攻击出现于1995到1996年间,它通过SYN标识的TCP包洪泛来淹没网络设备和服务器的网络通信并严

学位

节奏矩阵网络安全DDoS攻击TCM-KNN异常检测

基于多模态监督学习的图像重排序算法研究

伴随着网络技术的迅猛发展,伴随着“互联网+”的概念的提出,网络上涌现出了大量的图像,人们也期待能够从这些海量的图像中快速找寻到自己需要的图像。由于目前的图像检索系统

学位

图像检索重序监督学习多模态学习

基于缓存一致性协议的高可靠性扩展研究

在现代的多处理器芯片中,由恶意攻击和系统错误引发的软错误现象越来越常见,尤其对云存储服务器中的大型、多层缓存系统而言更是如此。在此背景下,如何提升数据可靠性已经成

学位

缓存一致性协议软错误冗余错误修复

足球视频中运动员的检测与跟踪算法研究

针对现有的运动目标检测与跟踪方法在动态场景中效果不佳的情况，以足球视频中运动员的检测与跟踪为研究对象，论文在现有算法理论的基础上，改进了相关算法实现对球员的检测与跟踪

学位

运动目标检测足球视频跟踪算法高斯混合模型球员检测算法

面向电子政务的轻量级工作流管理系统的研究与实现

电子政务是以计算机网络技术为基础,以共享、交流、协作为核心,以政务信息流、工作流相对集成为结构的政务管理模式。通过信息资源的配置和工作流的重组,使政府工作效率更高,

学位

电子政务轻量级工作流工作流管理系统工作流引擎

基于支持向量机的语音识别技术

语音识别技术作为信息社会朝着智能化和自动化方向发展的关键技术之一，具有重要的研究意义和实用价值。经过近五十年的艰苦探索和研究，语音识别技术研究获得了极大的发展，其中有

学位

支持向量机语音识别特征提取学习训练经验模态分解算法主频谱值

基于Hibernate的数据维护工具的研究与应用

随着信息技术的发展,越来越多的企业采用信息系统为它们的工作服务,为了满足不同企业对同类系统的需要,例如绩效考核管理系统,系统必须具备良好的跨数据库功能。Hibernate是

学位

数据维护工具数据监控持久化类排序算法性能优化

H.264标准在H.323系统中的应用

随着现代通信技术、Internet以及计算机技术的飞速发展,使得基于IP网络的视频会议系统H.323已经被越来越广泛的使用,而同时随着视频编码标准的不断更新,其优势已经越来越为人

学位

H.323H.264Openh323+RTP

基于行为图博弈的Nash均衡算法研究

其他学术论文