论文部分内容阅读
众所周知,最大值原理是研究最优控制问题的一个重要方法。但是,当需要考虑的控制系统伴随状态限制,尤其是sample-wise的状态限制(即状态以概率为1落在给定集合中)时,随机最优控制问题很难解决。为了处理这样的最优控制问题,最近终端扰动方法被引入,并且这种方法已经在金融最优问题中得到相应的应用(如[10-13])。终端交分方法是基于Bieleckiet在[3]及El Karoui,Peng和Quenez在[7]中引入的,主要应用Ekeland变分原理来处理状态限制并得到随机最大之原理的对偶方法(也称之为鞅方法)。
在这篇文章中我们将研究控制系统为伴随初始和终端状态限制的时间对称的正倒向随机微分方程的最优控制问题,应用终端扰动方法和Ekeland变分原理本文得到随机最优控制的必要条件,即随机最大值原理,并将主要结果应用剑控制系统为倒向重随机线性控制在内的几个具体模型中。