Markov控制过程在紧致行动集上的迭代优化算法

来源 :控制与决策 | 被引量 : 0次 | 上传用户：flyfish11111

【摘要】

：

研究一类连续时间Markov控制过程(CTMCP)在紧致行动集上关于平均代价性能准则的优化算法.根据CTMCP的性能势公式和平均代价最优性方程,导出了求解最优或次最优平稳控制策略的

【作者】

：

唐昊奚宏生殷保群

【机构】

：

中国科学技术大学

【出处】

：

控制与决策

【发表日期】

：

2003年3期

【关键词】

：

MARKOV控制过程紧致行动集性能势策略迭代数值迭代 Algorithms Convergence of numerical methods Itera

【基金项目】

：

国家自然科学基金，国家高性能计算基金

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

研究一类连续时间Markov控制过程(CTMCP)在紧致行动集上关于平均代价性能准则的优化算法.根据CTMCP的性能势公式和平均代价最优性方程,导出了求解最优或次最优平稳控制策略的策略迭代算法和数值迭代算法,在无需假设迭代算子是sp-压缩的条件下,给出了这两种算法的收敛性证明.最后通过分析一个受控排队网络的例子说明了这种方法的优越性.

其他文献

基于PDA思想的分布式多传感器融合方法

在传感器观测噪声不一致或有异常数据存在的条件下,分布式数据融合因没有剔除严重偏离真实值的传感器估计值,从而影响下一步的融合估计.对此,利用概率数据互联的思想,设计以

期刊

分布式数据融合概率数据互联预测域定向概率数据互联distributed fusion PDA validation region DPDA

基于特征点的机器人快速自定位研究及应用

提出一种在已知的结构化环境中,利用激光传感器信息进行移动机器人快速自定位的算法.该算法从传感器信息中快速提取环境特征点,根据特征点的坐标映射模型,确定机器人的坐标和

期刊

特征函数特征点坐标映射机器人足球赛Eigenvalues and eigenfunctionsMobile robotsPosition contr

基于X射线图像的视觉伺服同步控制技术

针对X射线检测实时成像管道机器人工作的特殊性,提出一种基于基准铅丝X射线图像的管内、外旋转机构伺服同步跟踪旋转控制技术.X射线使用于传递同步跟踪信息的基准铅丝与焊缝

期刊

同步控制技术管道机器人X射线检测实时成像视觉伺服Computer visionImaging techniquesMobile robotsRe

汽车悬架球铰总成动态试验台的研制

分析了汽车悬架球铰总成动态试验台的技术特点，阐述了其控制原理和研究路线．

期刊

汽车球铰动态多向加载试验台automotive ball joints multi - directional dynamic loading te

谈外语教师对外语学习不良归因的引导

归因理论对第二语言教学具有重要的指导意义。学生在外语学习过程中存在一些不良的归因倾向，对其外语学习产生消极的影响。教师应该在归因理论的指导下，对学生的错误归因适时引

期刊

归因偏差第二语言习得attribution error second language acquisition

目的视角下的译者翻译行为研究模式探讨

从目的论出发，提供了一个更具关联性的研究模式，即把翻译看成是一次有目的的行为，从目的的产生，目的对译者翻译行为的影响，及这种影响在翻译结果中的体现出发对译者的翻译做出更科

期刊

目的论译者翻译行为翻译目的Skopnstheorie translator translation action translation pu

聚氨酯／纳米无机粒子复合材料研究

以PTMG、TDI、MOCA为原料，采用预聚法合成聚氨酯弹性体，并选用纳米无机粒子对聚氨酯弹性体进一步增强，通过对纳米碳酸钙、纳米二氧化钛进行表面改性处理，研究了纳米粒子含量、游

期刊

聚氨酯纳米无机粒子复合材料polyurethane（PU） inorganic nanoparticle composite

Markov控制过程在紧致行动集上的迭代优化算法

其他学术论文