双人零和博弈问题中策略搜索算法的研究

来源 :大连理工大学 | 被引量 : 2次 | 上传用户:szcbg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双人零和博弈问题是机器博弈研究的一个重要方向,其研究内容涉及知识表示、博弈树搜索算法、局面状态评估函数等。其中,如何制定高效准确的博弈树搜索算法是提高智能体在零和博弈问题中决策质量的关键技术。极大极小算法作为最常用的博弈树搜索算法,从理论上讲,当计算能力达到可以搜索整棵博弈树时,该算法能够搜索得到完备信息零和博弈的最优解。由于计算能力有限,实际应用中通常使用带有启发式评估函数的极大极小算法。启发式评估函数的存在不可避免的会产生评估误差,有学者们对于带有启发式评估误差的极大极小算法的搜索质量提出了质疑。人们研究发现对于某些类别的博弈树,更深层次的极大极小搜索反而会降低决策质量。他们将这种现象称为“博弈树病理现象”。由于大多数真实的博弈问题整体上表现为非病理性,使得对于极大极小算法研究仍集中于通过提高搜索效率来提升搜索深度的方向。但是,病态节点被认为存在于所有的博弈树中,不可避免的影响着启发式极大极小算法的搜索质量。本文通过分析博弈树病理现象以及极大极小算法产生搜索偏差的原因,提出了优化经典极大极小算法备份规则后的搜索算法,并将其命名为迭代最优极大极小(IOM)算法。通过在人为构建的模拟博弈树以及真实博弈问题中的实验,表明迭代最优极大极小算法在浅层的搜索中相较极大极小算法表现出了明显的优势。当搜索深度较高时,这两种算法的搜索结果趋于相似。该搜索算法表现出更好的健壮性,为极大极小算法在浅层搜索中搜索结果偏差较大的问题提供了解决思路。同时,本文还将迭代最优极大极小算法同误差最小化极大极小(EMM)算法进行了对比。误差最小化极大极小算法是为了降低病态节点对搜索质量的影响而提出的基于预先区分节点类型思想的搜索算法。但误差最小化极大极小算法存在启发式函数误差水平难以准确设定,算法复杂度无法降低等问题。为体现迭代最优极大极小算法在复杂度方面的优势,本文还提出了迭代最优极大极小算法的alpha-beta剪枝策略。最后,通过在真实博弈环境中的对比实验表明迭代最优极大极小算法同样具有更高的决策质量。
其他文献
基于Lawless建立的跨国企业与生产成本均衡模型,分析技术性贸易壁垒(TBT)对异质性企业出口行为的影响,并运用双重差分法进行实证检验后发现:TBT会迫使低生产率企业出口产品退
条码技术是利用光电扫描阅读设备识读条码信息并将其输入计算机的技术。条码具有传输速度快、差错率低等优点,通过条码技术对标准化项目档案进行监管,改变档案的采集方式,提
2009年10月份以来,全球油脂油料市场在消化了美国大豆产量创纪录的利空数据后,受全球通胀预期升温以及美元大幅下滑带动,走出了触底反弹的行情。由于新季油籽上市之前,中央政府适
<正>一、设计思路本节课是将纸牌魔术和数学常规教学相结合的创新课程,纸牌魔术贯穿课堂的始终,具有挑战性与神秘性,提高了学生的兴趣与参与度,大大激发了学生学习数学的欲望
道德智慧的获取从实践中未,更应该回到实践中去。相对于其他体验活动,学生在调查实践活动中面对的不是生活的“复制品”,而是确实的“真品”,只有全身心“参与”到生活中去调查,才