基于模拟退火算法的自适应博弈学习模型

来源 :2005中国控制与决策学术年会 | 被引量 : 0次 | 上传用户:zhj8028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  有限理性参与者之间的博弈问题是人们十分关注的研究项目.目前已提出了一些博弈学习模型,但都存在一定的局限性,给出了博弈学习的一个改进方法,建立了新的基于模拟退火算法的博弈学习模型.计算机仿真实验表明,新的博弈学习方法的实用性和有效性有了很大的提高.
其他文献
本文针对一类混沌系统,提出一种基于观测器的同步反馈控制器的设计方法,即先对该类混沌系统构造其观测器,再利用观测器设计出相应的反馈控制器,从而将反馈控制器的设计转化为一个纯代数问题,仿真结果表明了该方法的有效性.
本文针对一类高阶下三角随机非线性系统,提出了一种新的调节控制方案,采用增加一个幂积分的方法构建一个全局稳定的光滑状态反馈控制律,通过反馈占优设计方法和Young不等式处理随机系统的非线性项,取消了对随机非线性系统反馈线性化和控制输入呈线性的要求.基于Lyapunov方法,证明了闭环系统依概率全局渐近稳定.通过仿真实例说明了算法的可行性.
本文利用紧支集正交小波变换的逼近滤波特性分析了Wiener过程小波逼近系数的统计性质,给出了维纳过程小波逼近系数的相关矩阵计算公式.基此研究了双线性连续随机系统的参数辨识问题,得到了系统参数的Markov估计及其递推算法,数值仿真计算研究表明所提算法是高效可行的.
本文研究基于包含原理的大系统重叠结构分解方法对系统控制性能的影响.以两区域互联电力系统为例,在不同的重叠结构分解方法下,利用鲁棒镇定的LMI算法对系统进行控制仿真.研究表明,不同的重叠结构分解方法使系统具有不同的动态性能和鲁棒性能,并且动态性能和鲁棒性能不可兼得,因此在进行系统设计时应该折衷考虑.
移动机器人路径规划的目的是在地图中找到一条可行性高的路径,所得到的路径应具有长度短、路面宽、无碰撞或堵塞的特性.分析比较了机器人工作环境与阻抗网格电路之间的类似性,利用电路中电流集中于阻抗值最小通路的原理,即最大电流通路具有与实际环境中可行性高路径的相互对应性,本文尝试了一种基于阻抗网格电路的路径规划方法.这种方法有效地对路径的长度、宽度、行驶时间等指标进行了综合评估,而且从根本上避免了人工势场法
本文利用P-C混沌同步方法,结合西部大开发的形势,分析房地产投资的资本驱动系统与西部大开发的目标要素响应系统之间的混沌同步作用,建立混沌同步模型.根据西部大开发的不同发展阶段,提出房地产投资和西部大开发协调发展的混沌同步策略。
本文针对企业集群合作网络供应链中各节点合作动机、合作均衡和合作归宿问题,提出运用经济博弈理论,建立集群网络供应链合作竞争模型,并进行均衡分析,得出集群内单链供应链节点间存在较大的合作空间,而并行供应链相同环节节点间竞争性空间较大、合作较难的结论。
本文针对选矿生产这一复杂工业过程的调度系统进行研究,目的是加快生产调度数据的工作效率.并及时准确地收集和发布企业生产状况和市场的信息,以辅助企业领导决策,实现生产调度工作的网络化、业务处理的自动化以及数据共享的信息化.在总结国内外企业生产调度系统现状的基础上,提出了应用3层的CIMS框架结构,面向典型的选矿生产过程,综合考虑企业的实际业务,围绕选矿MES中生产调度系统的设计与开发问题进行了系统深入
时间序列预测在许多领域得到广泛应用,现有的统计和机器学习方法难以处理复杂的非线性时间序列预测.本文提出一种结合小波分解和支持向量机(SVM)构建非线性预测模型的方法.小波作为一组滤波器对时间序列分解,分别重构得到易于建模和预测的多个尺度的序列.对每个尺度序列采用不同的嵌入维数重构相空间并利用支持向量机为每个尺度建立非线性回归预测模型,将每一模型的预测值融合作为输出.该模型用于上海股票市场预测,试验
本文试图建立一个侵权与维权的完全信息动态博弈模型,通过对博弈行为及其纳什均衡特征的分析,从理论上提出制约和防止侵权行为的逻辑结论:1)提高侵权行为的法定成本,抑制侵权行为"收益"大于成本的预期;2)排除和预防即发侵权行为,提高侵权行为的实施成本;3)降低维权成本,提高维权成功率。