论文部分内容阅读
动态规划原理(Dynamic Programming Principle,简称DPP)是最优控制理论的一块重要基石.它讨论的是一族控制系统问题的值函数做为关于初始时间t和初值x的函数所应满足的动态关系.在控制系统没有区域限制时,由倒向随机微分方程(Backward Stochastic Differential Equation,简称BSDE)描述的指标泛函所对应的值函数满足的动态规划原理已经由彭实戈于1992年证明.当区域受到限制(区域为O)时,由于引入了停时(τ)=inf{t>0,Xt(∈)(O)},值函数u将不再保持连续性. 本文研究对象为区域上,指标泛函由倒向随机微分方程定义的随机控制系统.运用Lions在文献[13]中使用的方法证明区域上的动态规划原理,然后证明了在一定条件下值函数关于初值x和时间t的连续性,最后运用BSDE的方法,证明控制系统值函数是相对应的Hamilton-Jaccobi-Bellman(简称HJB)方程满足终边值条件的唯一粘性解.