论文部分内容阅读
21世纪以来,随着世界经济一体化以及互联网信息技术的快速发展,不同组织、不同个体之间的相互联系已日趋紧密,寻求稳定合作、共同发展的可持续发展战略已经深入每一个领域中。本文通过在重复囚徒困境博弈模型(Iterated Prisoner’s Dilemma,IPD)中引入收益流风险(Income Stream Risk)的概念,研究了个体追求稳定收益,即长期稳定可持续发展,这一目标对个体的合作行为的影响。主要的研究内容与创新性工作包括:(1)介绍了合作问题研究的背景、意义以及IPD合作问题研究的基本方法;综合评述了IPD合作问题的研究现状,并提出本文研究的关键科学问题与框架。(2)基于收益流风险的概念,将IPD博弈中的风险定义为博弈者在所有阶段PD博弈中收益的标准差,构造了基于收益与风险的博弈效用函数;利用基于小生境技术的双种群协同进化算法模拟了两方IPD博弈过程。实验结果表明,博弈者的风险规避行为对合作有着显著的促进作用。特别地,尽管先前文献指出“合作在重复博弈次数较少的IPD中很难形成”,本文实验证明了若IPD中的两个博弈者均为风险规避者,则双方在重复博弈次数较少时亦能形成高度合作均衡。(3)基于前景理论中的“个体在实际收益低于期望收益时将变得风险偏好,在实际收益高于期望收益时将变得风险规避”的结论,构造了agents风险态度与博弈策略协同演化的多agents演化IPD博弈模型。考察了agents分别基于历史收益比较(历史比较)、社会收益比较(社会比较,即群体平均收益比较)进行风险态度调整时,博弈群体的合作演化结果。实验表明,博弈群体在历史比较下将倾向于风险规避行为;因此,agents之间能形成高度合作均衡;但在社会比较下,agents在相互博弈时将倾向于风险偏好行为,仅表现出了较低的合作水平。(4)在上述多agents演化IPD博弈模型中进一步引入了agents的局域化博弈以及差异化博弈关系,研究了agents在局部博弈策略以及差异化博弈策略学习下,博弈群体的风险态度调整对合作行为的影响。实验结果表明,在这两种博弈情形下,博弈群体在历史比较下仍呈现出了全局合作均衡,并且在社会比较下呈现出了局部合作行为。此外,在对博弈收益进行高斯扰动后,发现在不确定收益下,博弈群体基于社会比较的局部合作要稳定于其基于历史比较的全局合作。