不确定半马尔可夫系统最优鲁棒决策研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:z11272037
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半马尔可夫决策过程(SMDP)可用来描述实际生活中很大一类离散事件动态系统,即半Markov系统。实际的系统不可避免地存在不确定性,而且对系统的优化往往涉及多极值优化问题,这使得对不确定SMDP鲁棒决策的研究更具现实意义。本文的主要工作是研究利用全局优化方法求解不确定SMDP的最优鲁棒控制策略。 SMDP一般是通过等价的马尔可夫决策过程(MDP)来分析研究的,同时对不确定SMDP的研究也是以确定性SMDP为基础的,故论文首先介绍了等价MDP的概念和确定性SMDP系统基于性能势的优化方法,再介绍不确定SMDP基于性能势的鲁棒决策求解的统一算法,它适用于平均和折扣准则两种情况。针对系统优化过程中可能涉及的多极值优化问题,本文重点介绍了用以解决这一问题的两种全局优化方法,即模拟退火算法和填充函数法。详细讨论了基于全局优化的系统优化方法在各种不确定SMDP鲁棒决策问题中的应用,包括在不相关不确定参数条件下求解系统最优鲁棒控制策略的策略迭代算法,和在相关不确定参数条件下求解系统最优鲁棒控制策略的一类极小极大优化算法。在每种参数条件下又分为两种情况,分别是仅等价无穷小生成子依赖系统参数,和性能函数与等价无穷小生成子都依赖系统参数。 本文以SMDP的数值实验方式,说明了有关算法在各种不确定情况下求解鲁棒决策问题的运用,验证了算法对折扣和平均两种准则是统一的:通过大量实验结果分析,讨论了各种算法在不同情况下的优化效果,以及针对不同情况选择和使用算法的建议;论文研究结果对建立实际半Markov系统的鲁棒决策机制具有一定理论和应用价值。
其他文献
现代企业最有价值的信息往往是保存在数据库中的。企业非常关心怎样确保数据库的保密性、完整性和可用性。随着Internet的日益发展,数据库的网络化,使企业数据库所面临的威胁也
为了对Web服务资源进行有效的管理,Web服务社区的概念应运而生。Web服务社区被定义为具有相同功能特性和不同非功能特性的Web服务的集合。随着复杂业务流程和组件重用的日益
近年来,随着3D技术的飞速发展,3D视频必将代替2D视频,给人们带来绝无仅有的视觉盛宴。3D视频增加的景物深度信息,使得视觉的逼真感和现实感增强,喜爱人数众多,也因此,众多影视公司纷
软件Agent是近年来倍受人们关注的热点问题,其根本原因是学术界认为它是能够使软件取得重大突破的关键技术之一。针对软件Agent的反应性、自治性、自发性、可进化性、社会性
随着计算机网络技术及其相关技术的不断发展,Web作为强有力的通信渠道,比C/S应用表现出很多优越性,许多应用系统的开发由C/S应用转向了B/S体系结构。 但这种模式下的应用
最近十年,计算机图像分割在医学图像处理中起着越来越重要的作用。图像分割的目的在于帮助我们更好地理解感兴趣的对象边界特征,在疾病诊断和治疗、医学图像可视化以及计算机集
随着互联网和信息技术的飞速发展,电信运营商的用户群越来越大,网络规模和复杂程度与日俱增,对网络管理提出了更高的要求。 本文以黑龙江电信IP网管系统的设计与实现为例,
本文在分析企业信息化基本特征的基础上,对企业信息化的内涵和概念进行了界定,提出了企业信息化的评价方法和评价原则,最后给出了企业信息化的评价模型和指标体系.
本文以西班牙马德里事件作为实验对象,研究突发事件领域的文本信息特点,探索突发事件模板的自动获取。通过机器学习方法,建立了相关事件模板,用于表述信息各个侧面的特征。并运用
近年来,随着互联网技术的迅速发展,互联网的规模不断扩大,由此导致的能耗问题日趋严重。为此,人们提出旨在节约能耗的绿色互联网的概念。目前,针对绿色互联网的研究已成为国