马尔可夫决策过程两种抽象模式

来源 :计算机科学 | 被引量 : 0次 | 上传用户:yueyingz4l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抽象层次上马尔可夫决策过程的引入,使得人们可简洁地、陈述地表达复杂的马尔可夫决策过程,解决常规马尔可夫决策过程(MDPs)在实际中所遇到的大型状态空间的表达问题。介绍了结构型和概括型两种不同类型抽象马尔可夫决策过程基本概念以及在各种典型抽象MDPs中的最优策略的精确或近似算法,其中包括与常规MDPs根本不同的一个算法:把Bellman方程推广到抽象状态空间的方法,并且对它们的研究历史进行总结和对它们的发展做一些展望,使得人们对它们有一个透彻的、全面而又重点的理解。
其他文献
PB-linkTree通过哈希定位将B+树分布到多个节点上,解决了动态P2P环境中索引的完整性和准确性问题。实验表明,即使节点频繁加入或离开系统,仍能保持数据的可靠性和一致性。而且,PB-
本文分析了密码系统安全实现的动机、任务就及目标,并将容侵思想应用于系统的安全实现,提出了一种基于失败-停止协议的容侵机制的设计方法。
为了克服话题检测中使用静态阈值的缺点,我们提出了基于时间信息的动态闽值模型。在该模型中,探索了一种比值法来选择与某个特定报道最相似的话题。实验结果表明,动态阂值模型很
本文给出了k(k≥2)阶带形状参数指数多项式的均匀B样条模型。该类模型具有很多与B样条模型相同的性质,并且具有一个可调节的形状参数。由该模型构造的曲线,通过改变形状参数的取值,可以调整曲线接近其控制多边形的程度。该模型可以应用于CAD/CAM领域,作为几何造型一种新的有效模型。
计算机读图是旨在提高建筑业的自动化、信息化程度的一种重要技术。通过从计算机读图的角度对建筑工程图表示特点的分析和对人工读图机理的分析,本文提出了基于建筑工程图表示特点、借鉴人工读图机理的按序、定向、整体的计算机读图思路,并在此基础上给出了建筑工程图自动识别的描述方法和实现技术。
让计算机具有认知和表达自己情感的能力,培养其智能地对人类的情感做出反应是现阶段信息科学研究的热点内容。本文构建了基于动态Q学习算法的情感自动机模型,在该模型中,定义了
在Prolog程序分析中,考虑程序的执行路径和非逻辑的cut操作可提高程序分析的精度。当前用于Prolog程序路径依赖分析的语义因依赖于程序执行的目标而不适合目标独立的程序分析
用粗糙集近似描述了三类常见信息系统(即Pawlak信息系统、不完备信息系统、不完备模糊信息系统)中对象的基本信息粒度。通过信息系统中对象属性值关于对象属性近似空间的上近似
为了更好地解决高维海量数据的分类问题,本文提出一种基于粒度计算的覆盖算法。该算法以粒度计算为理论依据,指出在分析研究某一问题时,可以适当将其属性、论域或者结构粗化,求得