Markov控制过程的优化理论和算法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yanghongtao3446
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中的很多随机人造系统,如高速通讯网络、柔性制造系统、质量管理系统等,都可用Markov过程来建模,为适应这类问题的优化控制和设计的需要,论文重点研究了一类Markov控制过程在无限时间水平平均性能准则下的优化理论和优化算法.性能势在Markov系统的分析和研究中起着重要作用.我们用广义Poisson方程的解来定义Markov性能势,并通过平衡方程和广义Poisson方程,建立了连续时间Markov控制过程基于性能势的最优性原理,以及基于性能势的平均代价最优性方程,又称之为基于性能势的Bellman最优性方程,在较弱的假设条件下,我们得到了这个最优性方程在紧致行动集上解的存在性定理,给出了求解平均代价最优策略的几种算法,即梯度算法、策略迭代算法和数值迭代算法,并且详细地研究了迭代算法的收敛性,说明了这些算法在有限步内能确保得到epsilon-最优策略.这些研究结果都能直接运用到离散时间Markov控制过程中,并且为进一步研究一般Markov控制过程的优化问题和设计求解最优策略的优化算法,提供了一个统一的基本的理论框架.
其他文献
本文以武汉理工大学校基金项目“九点控制器”的研究成果为依据,提出了一种基于九点控制器算法的水轮机调速系统。 水轮机调速系统是影响电力系统运行质量和安全的最重要的控制系统之一。目前已突破传统的控制模式,采用工业控制计算机技术,特别是采用了高可靠性的PLC,数字网络化的现场总线技术,工业计算机监控技术,将水轮机调速技术提高到了一个调节与监控兼备的现场网络控制阶段。其硬件组成多采用总线式工控机(S
随着网络教育的诞生与发展,教育信息化、社会信息化进程不断推进,社会对网络教育的质量要求也越来越高。网络课程人性化、创造性思维培养和教育网络安全成为人们对优质网络课程
隧道窑是耐火材料制品生产的一种高温烧成设备,温度控制的好坏直接影响到耐火材料制品的产量和质量,因此温度控制策略是隧道窑控制系统中的重要研究内容。如何制定满足工艺要
该文对摄像机内参数的标定和运动参数的恢复做了进一步的探索研究,主要工作可以归纳为下:(1)基于圆的摄像机自标定方法.首先定义平面上两圆的关联直线,再证明的同一平面上相
本学位论文结合国家自然科学基金项目“精密装置仿生隔振系统理论及基础技术研究”(No.50075078),从理论分析和实验研究两方面,对SMR模型的功率传递特性、微制造隔振平台控制理
算法是实现系统功能的灵魂,实用化的算法是系统设计的基础,为实现低对比度、低信噪比的小目标自动检测和跟踪功能,该文深入分析研究国内外在红外小目标检测跟踪方法,结合项目
对混沌现象的研究是非线性科学中重要课题之一,混沌运动是一种确定性的类随机运动,它广泛存在于客观世界中,由于混沌的奇异特性,不施加控制的混沌将无法应用,混沌控制是混沌走向应
热疗是一种新型的治疗癌症的方法,它通过微波对癌组织加热来治疗癌症。在微波(或高频电)作用下,人体组织加热到42-44℃,癌细胞被杀死,正常组织却能保存。保证热疗效果需要准确测量加热温度。为此,本文提出一种新型的医用荧光光纤测温方案,其主要特点是采用纤细的(0.2mm)光纤作为测温探头。 由于采用细光纤作为探头,导致采集到的信号很微弱,要提高测温精度,研究的重点必须放在减少噪声,提高信噪比上。
本文分为五章:第一章:绪论.第二章给出了数学上的预备知识,包含微分流形,李群和黎曼几何等,重点介绍了联络的概念.第三章回顾了拉格朗日力学基本概念,然后介绍了机器人运动系
根据早期视觉的观点,纹理是一种基础的视觉现象。针对车牌纹理特征,本文利用Gabor小波滤波能模拟人类视觉的特点,研究了基于纹理分析的车牌图像分割技术。 本文的主要工作如