论文部分内容阅读
均衡一直是经济学研究的重要问题,更是博弈理论中的核心概念.均衡思想的发展决定了博弈论的基本前进方向.不管是基于零和博弈的冯·诺依曼最大最小均衡还是针对一般博弈的纳什均衡都是基于完全理性的假设提出的,它们背离了“理性有限性”这一客观实际.随着演化博弈论的不断发展,人们普遍认为,均衡是在有限理性参与人的不断重复博弈中实现并变化的.在一个动态博弈中,当相互影响的各要素处于一种状态时,任何一种要素都没有单独离开该状态的倾向,则该状态为动态博弈的一个均衡.均衡分析的核心就是对重复博弈动态系统的状态向量进行分析,找出均衡实现的路径.论文首先对影响博弈均衡的要素进行了系统研究与分析.博弈由博弈主体、博弈语境和信号三个基本要素组成,而信息、理性和效用则是博弈主体的根本属性.这些要素共同决定博弈主体在博弈中的行为.博弈主体的根本任务就是要通过对博弈语境的学习,使主观认识和客观事实不断接近,理性不断改善,最终在均衡路径上获取较优的博弈效用.论文对信息的描述方法进行了系统分析,提出了以主题、事件和概率为主要构成的分布式描述方法,并建立了基于时间和空间的信息二维测度模型.同时,在对理性本质进行综合分析的基础上,建立了理性形式化表示的具体思路和方法.论文提出了基于占优理性的多种典型均衡概念.文章指出占优均衡是在占优理性支配下实现的.占优理性不等于完全理性,占优理性是有限理性的一种典型形式,而完全理性则是一种理想主义状态.文章提出了互制均衡和互利均衡这两种典型均衡概念.互制均衡强调以个体理性为中心的自我实现,倾向个体利益最优,忽视博弈群体对自身行为的影响,博弈结果常常会与博弈者提高效用的宗旨背道而驰.这种以个人占优为出发点而形成的博弈均衡往往不能取得帕累托优化的结果.互利协调是互制均衡的进一步精炼,在强调自我实现的基础上,注重双赢,引导合作.互利协调和互制均衡都是演化的聚点.通过对既存在互利协调又存在互制均衡的多态非退化博弈的动态分析,系统探讨和研究了协调和均衡的到达路径.论文对基于帕累托均衡优化的期望均衡进行了研究.期望均衡是博弈局中人或局外人对于博弈均衡点的一种期望.显然,期望均衡应该帕累托优于纳什均衡.期望均衡强调互利共赢,它要求博弈群体的每个成员对期望均衡点有一个共同的预期.要实现这种期望均衡,可采用局中人参与的训练与学习使得群体的预期一致.博弈训练者通过重复的博弈偏离行为向其它博弈者传递训练信号,使学习者对博弈语境的认识发生改变,进而引导学习者采取更有利于训练者的行动.在使用博弈训练时,应遵循“利已、利他、可信、可辩”的原则,从全局的角度审视整个博弈环境,选择利己利他的训练方法,最终取得较优的训练效果.当然,不同理性的人对于训练者的偏离行为有着不同的理解.具有模仿学习理性的主体将模仿对手的偏离行为,具有反应学习理性的主体将针对对手的偏离行为采取最佳的反应.而具有跟进理性的学习者则认为对手的这种偏离行为代表了一种对博弈结果的预期,如果识别这种预期并跟进,将带来比自由博弈更好的双赢结局.此外,论文对采用第三方过滤器来实现期望均衡进行了研究.在基于过滤的期望均衡中,策略组合概率的形成,是由个体策略选择和第三方约束机制所共同决定的.第三方过滤器在设计时,必须保证约束条件的均衡性和总体最优性.特别重要的是,群体利益是在不违背个体利益的基础上取得的.在第三方均衡的概率分布下,任何参与者都没有偏离的动机.否则,第三方过滤器就是不公平的,形成的约束条件也就是不稳定的、无效的.最后,文章从语境、信息和理性三个方面对均衡实现的有效性进行了分析.在不同的语境下,博弈双方将受到不同的制约,获得不一样的效用.在同一语境下,如果信息使我们的信念逼近事实,则一定会带来更多的效用.当然,信息的获取有可能改变博弈的环境,从而影响信息在均衡实现中的效用.通过对不同理性下的均衡动态分析,文章得出了一些有益的结论.有限理性博弈者的参与,有可能使博弈双方走出占优博弈的困境.但是,基于简易模仿和简易训练的重复博弈未必是有效的.由于主体行为是相互影响的,所以训练策略必须是互动的,而不是一成不变的.IPD模型中不同理性持有人的行为在本质上也是一种训练,因为他们的行为隐含了对于博弈的一种期望.