非零和随机微分博弈及相关的高维倒向随机微分方程

来源 :山东大学 | 被引量 : 0次 | 上传用户:iamfly2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
这篇学位论文主要研究了马尔可夫框架下的多人非零和随机微分博弈理论及其相关的高维倒向随机微分方程。论文涵盖四个主要结果。首先,我们考虑了一个非零和随机微分博弈模型,其系统状态过程的漂移系数不有界,而是线性增长的。同时也研究了一些扩散项系数不有界的例子。在广义Isaacs条件下,通过证明相关的高维倒向随机微分方程解的存在性,我们给出了纳什均衡点的存在性。其创新点在于,这个倒向方程的生成元关于波动过程z是随机线性增长的。第二个问题研究的是风险敏感的博弈模型,其效用泛函是指数形式,且带有不有界系数。与其相关的倒向方程是高维的,生成元为平方增长的。我们给出了纳什均衡点的存在性。第三个问题研究的是带有不连续哈密尔顿函数的bang-bang博弈问题。在这种情况下,纳什均衡点存在并且是以不连续的形式呈现。其意义是指,控制过程不连续,会在某些点发生跳,且只在控制域的边界取值,取值取决于值函数的导数的正负。倒向随机微分方程在这里是一个耦合的高维系统,其生成元关于波动过程z是不连续的。最后,我们研究了一个递归的随机微分博弈问题。其意义为瞬时效用泛函不仅与瞬时消费速率有关而且还与未来的效用有关。此模型所对应的倒向随机微分方程为高维,且生成元关于波动过程z随机线性增长,关于值过程y有随机单调性。在这篇学术论文中,主要有四个主要结果,都是有关非零和的随机微分博弈问题。我们在这里简单地总结这四个主要结论,并且给出文章的框架结构。1.带有非有界系数的零和随机微分博弈这篇学术论文的第2章是与Hamadene教授合作发表于杂志Stochastics An Interna-tional Journal of Probability and Stochastic Processes ([64])。第2章,我们研究了一类控制对抗控制的马尔可夫的非零和随机微分博弈问题,其中,扩散过程σ不依赖于控制。整体框架与Hamadene et al. [58]类似。更广泛的多人参与的情况,我们在小节1.1.3中介绍。现在,为了简便,我们回忆一下两人参与的非零和随机微分博弈(NZSDG)的问题陈述。事实上,本章所有的结果和技巧都可以很容易的被推广到多人的情况。一个简单的NZSDG如下:从下文定理1.3看出,文章[58]只考虑了SDE(0.0.1)的系数f和σ是有界的情况。而系数无解的情况没有被研究过,例如系数是线性增长的。因此第2章的主要目的为尽可能的放松系数f和σ的有界性。我们主要把f扩展到了线性增长的情况,σ的不有界性在第2章的最后扩展部分也有一些讨论。以下为我们施加的具体的假设条件:假设0.1.第2章结果的创新性在于,给出了这个NZSDG的纳什均衡点的存在性,其中漂移系数f不再是连续的,而是满足线性增长条件。问题的陈述与Hamadene, Lepeltier andPeng (1997)[58]是类似的。但在文章[58]中,系数f是有界的。文中的方法是强烈依赖于Girsanov概率测度变换的,我们需要处理σ-1f的Doleans-Dade指数。当系数σ-1和f都是有界的时候,显然,Doleans-Dade指数是一个概率密度。然而,当f为关于x线性增长时,这一结论就不再是这么显而易见的了。而且,一些好的相关的BSDE的性质和估计都需要重新证明,这就是这个工作的难点所在。用于克服这一困难的一个非常有效的工具为Haussmann(1986)的结果(见定理2.1)。定理给出了在f为线性增长的情况下,相应的Doleans-Dade指数的可积性。根据这一结论,我们得出σ-1f的Doleans-Dade指数是在Lp空间里有界的,其中常数p落在1与2之间。这样,即使f是线性增长的,有这个可积性结论,我们也可以顺利的使用Girsanov变换。另外,根据Haussmann的结论,我们也可以给出原始概率下的期望与新概率下的期望之间的联系。这在后文的讨论技巧中起了很关键的作用。与[58]一样,我们采用BSDEs的方法。命题2.1告诉我们,参与者的效用函数可以被下述的非标准的BSDEs的初始值来刻画。那么,我们可以证明纳什均衡点的存在(见定理2.1)。证明是通过比较BSDE (0.0.2)以及下面的BSDE (0.0.3),后者的生成元为依赖于反馈形式的控制的哈密尔顿函数。证明使用的是局部化技巧(localization scheme)。一旦我们可以说明BSDE (0.0.3)有解且满足适当的可积性条件,那么我们就有结论,这个博弈问题的纳什均衡点存在,即为随机过程((v*,v*)(t,xt0,x,Zs1,Zs2))t≤T。因此,这个问题的研究就转化为了研究下面的BSDE:这种特殊的BSDE是高维的,每一维之间通过波动过程耦合在一起。解决这种BSDE的难点在于,生成元含ziσ-1(t, x)f(t, x, (v*, v*)(t, x, z1,z2)), i= 1,2,其中,f不有界而是关于x线性增长。在马尔可夫框架下,我们可以看出BSDE (0.0.3)的生成元是关于波动项随机线性增长的,或者称为ω by ω线性增长的,或称为随机利普希茨的(见[8])。另外,其生成元为为带有反馈形式控制的哈密尔顿函数,且关于(z1,z2)是连续的。对带有随机利普希茨生成元的BSDEs的研究工作还包括Briand[15]。文章研究了含有BMO鞅的不规则生成元的BSDE。假设广义Isaacs条件满足,并且假设动力系统的漂移项的分布函数满足Lq-domination条件,我们最终可以证明这种特殊类型的BSDE有解,从而给出纳什均衡点的存在。我们可以验证,当系数σ满足经典的一致椭圆性条件的时候,Lq-domination条件是成立的。我们的方法大致为:(i)构造一列具有利普希茨系数的BSDEs的逼近序列。在马尔可夫框架下,他们的解过程(Yn,Zn),n≥1可以通过确定性的函数(ωn,vn),n≥1来刻画;(ii)给出(Yn,Zn)和(wn,vn)的一致估计。利用Lq-domination条件,我们可以在一个适当空间里的弱收敛结果里得到一列强收敛的子列(wnk)k≥1。这样,我们就导出了子列(ynk)k>1和(Znk)k>1的强收敛;(iii)最终,我们可以验证收敛列(Ynk,Znk)k≥1的极限就是原BSDE的解。总结一下,在整个的证明过程中有如下几点比较重要:(ⅰ)Haussmann的结果:存在某个p∈(1,2)使得,对任意的容许控制(u,v),都有E[(ζT(σ-1(·,xt,x)f(·,xt,x,v.,v.)))p]<∞其中ξT定义为(0.0.1);(ⅱ)Lq-domination性质及其变形;(iii)广义Isaacs条件。在这一章的最后,我们给出了一个示例,并且讨论了一些可能的扩展情况。例如,漂移系数f及扩散系数σ都不是有界的情况。2.带有不有界系数的风险敏感的非零和随机微分博弈第3章与S.Hamadene教授合作完成,见[63].第3章处理的是风险敏感的NZSDG.如我们在小节1.1.4中介绍的一样,这是一类考虑到参与者对于风险的喜好态度的博弈问题。对于其中三种风险偏好态度,包括风险厌恶、风险喜好以及风险中性的态度,我们可以阅读小章节1.1.4来了解更多。在本文的第3章中,我们主要采用风险厌恶的模型。另外,为了讨论方便,我们只采用有两个人参与的博弈模型。事实上,这一章节的所有结果都可以被自然的推广到多人参与的博弈问题中去。模型的建立是与标准的NZSDG类似的,见(0.0.1)。我们依然考虑系统的动态过程为一个扩散过程。然后我们将会建立它的弱表示形式,也就是通过Girsanov变换将原概率测度P转换为新的概率测度Pu,。这个状态过程的弱表示形式如下:dxst,x=f(s,xst,x,vs,vs)ds+σ(s,xst,x)dBsv,v,s∈[t,T]且xst,x=x,s<t.与经典情况唯一的区别为,效用函数更加的复杂,是指数形式的。这种形式的选取在经济领域是很自然并且合适的。对一个风险敏感的NZSDG,其效用函数陈述如下:对参与者i=1,2和任意的一对容许控制(u,v),效用函数为Ji(v,v)=Ev,v[e∫0Thi(s,xs0,x,vs,vs)ds+gi(xT0,x)].这个风险敏感的NZSDG的目标为找一个NEP,也就是一对最优的容许控制(u*,v*),使得J1(v*,v*)≤J1(v,v*)和J2(v*,v*)≤J2(v*,v)成立。注意在第3章中,所有的假设条件都与假设0.1相同:(i)扩散系数σ一致利普希茨,可逆,有界且其逆也是有界的。由这些条件可知σ满足一致椭圆条件;(ii)漂移系数f关于x线性增长;(iii)瞬时效用hi和终端效用gi都是关于x多项式增长的,i=1,2;(iv)Isaacs条件成立;(v)带有反馈控制的哈密尔顿函数是连续的。风险敏感的随机微分博弈问题的研究有很多,包括非零和、零和以及平均场的情况,例如[7,36,43,44,67,95]。其中,通常的解决办法有两种,一种是偏微分方程法,例如[7,43,44,67,95]。另一种方法是通过倒向随机微分方程理论,例如[36]。在第3章中,我们也是通过处理相应的BSDE来解决风险敏感的博弈问题,方法类似于E1-Karoui and Hamadene(2003)[36]。然而,[36]只考虑了漂移系数f是有界的情况。这种限制从某种程度上来讲是过于严格了。因此,我们的目的是尽量的放松f的有界性。我们如摘要中假设的一样,(见假设0.1)函数f不再是有界的,而是线性增长的。这是这篇文章的主要创新点。这种广义的风险敏感的NZSDG还未被研究过。在标准NZSDG中,效用泛函是可以被相关的BSDE的初始值所刻画。对于风险敏感的情况,也有类似的结论成立,效用泛函恰好等价于一类特殊的BSDE初始值的指数。这种等价关系,我们在第3章中陈述(见命题3.1).因此,寻找NZSDG的NEP等价于寻找如下BSDE解的存在性。这是一个带有连续系数的高维BSDE,其生成元同时含有z的线性项和平方项。解决这类BSDE的困难之处有如下两个方面:(i)第一个困难就是生成元中所含有的z的平方项。与标准的NZSDG相比,我们需要使用一些技巧来消除掉这个平方项。(ii)第二个困难是:生成元中有两部分,一个为波动过程的线性部分,也就是带有反馈控制的哈密尔顿函数。另一部分为波动过程的平方项。它们的形式为:Hi(s,x,zi,(v*,v*)(t,x,z1,z2))+1/2|zi|2=zif(s,x,z1,z2)+hi(s,x,z1,z2)+1/2|zi|2,i=1,2,其中f是关于x线性增长的。与摘要中类似,在马尔可夫框架下,z的线性部分是随机线性增长的,也就是ωbyω线性增长的。函数f是有界的情况已经在[36]中被研究。我们用来克服这些困难的方法如下:(i)’为了处理z的平房部分,我们采用经典的指数变换(见M.kobylanski et al(2000) [72]):Yi=eYi;Zi=YiZi,i=1,2.这种技巧可以将平方项消除掉。当然,作为代价,生成元中会被额外的引入值过程Yi的部分。(ii)’如经典的情况,f的线性增长性所带来的困难在于Girsanov变换不在是显而易见的。我们仍然利用Haussmann的结果来克服这一困难。见摘要,存在某个p∈(1,2),使得σ-1-f的Doleans-Dade指数形式的局部鞅是Lp可积的。这一结果可以保证我们采用Girsanov变换,从而将波动项从生成元中移出。那么我们将会更方便的得到BSDE解的可积性结果。在广义Isaacs假设以及扩散过程的分布函数所满足的domination性质下,我们最终证明了,BSDE (0.0.4)有解。同时,也给出了这个风险敏感的NZSDG的纳什平衡点。我们总结此方法的步骤如下:(i)首先进行经典的指数变换从而消除掉波动项的平方部分。那么原始的BSDE将会转换为一种生成元同时含有Y和Z的BSDE。且生成元是关于这两个变量ωbyω线性增长的;(ii)然后,我们会使用柔化技巧(mollifier technique)。也就是选取一列带有平滑系数的BSDEs来逼近原BSDE。这列逼近方程是有界的,因为其生成元为利普希茨连续的。另外,在马尔可夫框架下,它们的解(Yn,Zn),n≥1可以被确定性的函数(Sn,3n),n≥1来表示。然后我们证明了Sn的指数增长性质,从而给出了(Yn,Zn)的一致可积结果。(iii)我们可以找到一列强收敛的子序列(Snk)k≥1,从而给出了子序列(Ynκ,Znκ)κ≥1的强收敛性;(iv)我们最后验证了这个子序列(Ynκ,Znκ)κ≥1的收敛极限即为我们变形的BSDE的解。最后,我们再做对数变换,从而找到原BSDE(0.0.4)的解。3.非零和微分博弈的Bang-Bang形式的纳什均衡点第4章是与Hamadene教授合作完成,并且已发表在杂志Comptes Rendus Mathe-matique中(见[62])。我们先来介绍一下这个工作的出发点。我们注意到前面有关NZSDG的工作,例如[58,54,53,76],作者关心的只是平滑的反馈控制以及哈密尔顿函数。这篇学术论文的第2章和第3章也是这样。证明过程强烈的依赖于哈密尔顿函数的连续性(见假设0.1)。然而,对于带有不连续控制的情况,却没有太多的研究工作。不连续的控制在现实生活中是普遍存在的,尤其是经济和工程领域。因此,本章的主要目的为研究一类马尔可夫框架下的NZSDG。我们在一些合理的假设条件下,给出了一类不连续的纳什均衡点,在本文中是以bang-bang的形式呈现。主要运用的工具仍然是BSDEs,在我们的情况下为高维的,且其生成元关于波动过程z是不连续的。我们现在简单介绍一维情况下,两人参与的博弈模型。更广泛的高维以及多人参与的情况可以用类似的办法处理。假设动力系统的状态过程由下面的SDE描述,也就是对任意固定的(t,x)∈[0,T]×R,(?)s≤ T, Xst,x= x+(Ba∨t-Bt). (0.0.5)每个参与者都对系统施加他们自己的控制。我们设U和V为两个有界的R上的子集,且,M1(resp.M2)为容许控制的集合。容许控制v=(vt)t≤T(resp.v=(vt)t≤T)是从[0,T]×Ω映射到U(resp.V)的P-可测的过程。记M=M1×M2。令Γ:(t,x,u,v)∈ [0,T]×R×U×V→R为这个博弈问题的动力泛函(作为状态过程的漂移系数)。关于各系数的具体假设我们稍后介绍。对任意的容许控制(u.;v.)∈M,令Pu,v为(Ω,F)上的正概率测度,其定义如下:dPt,xu,v=ζT(Γ(.,X.t,x,u.,v.))dP,ζT(θ):=1+∫0tθsζsdBs,t≤T,其中,θ:=(θt)t≤T为任意的Ft-适应过程。在r满足适当假设条件下,Puv,t,x为(Ω,F)下的概率测度。则,随机过程Bu,v=(Bs-∫0sΓ(r,Xrt,x,ur,vr)dr)s≤T为(Fs,Pu,v)-布朗运动,并且(Xst,x)s≤T满足如下的SDE,dXst,x,=Γ(s,Xst,x,us,vs)ds+dBsu,v,(?)s∈[t,T] and Xst,x=x,s∈[0,t]. (0.0.6)我们记gi:x∈R→R,i=1,2为终端效用泛函。对固定的(0,x),我们定义玩家的效用函数如下,对(u,v)∈M, J1(u,v):=Eu,v[g1(XT0,x)]且J2(u,v):=Eu,v[g2(XT0,x)],其中,对于固定的(0,x),Eu,v为概率Pu,v下的测度。我们考虑纳什均衡点的存在性,i.e.一对控制(u*,v*)∈M满足,对任意的(u,v)∈M,都有J1(u*,v*)≥J1(u,v*)且J2(u*,v*)≥J2(u*,v).我们的假设为:假设0.2.(ⅰ)容许控制(u,v)的取值集合为两个有界的R上的子集,U=[0,1],V=[-1,1];(ⅱ)动力函数Γ为控制的仿射结合,有如下结构Γ(t,x,u,v):f(t,x)+u+v。其中,f:(t,x)∈[0,T]×R→R为Borel可测函数。函数f是关于x线性增长的,因此,Γ也是关于x,(u,v)∈U×V一致线性增长的。(ⅲ)终端函数gi,i=1,2是关于x多项式增长的。在这个NZSDG问题的提出中有几个重要的性质:(ⅰ)动力函数Γ并不是有界的,而是关于x线性增长的。这和之前很多关于NZSDG的文献不同(参考[58,54,53,76])。正如摘要中解释的一样,由Γ的线性增长性所带来的困难可以被一个Haussmann的结果克服(参考引理4.1)。这个结果是有关Doleans-Dade指数的可积性的。事实上,Girsanov变换可以被顺利的使用,从而导出弱形式下的状态过程(0.0.6)。(ⅱ)容许控制过程的值域U和V是两个具体的R上的有界子集。.另外,动力函数Γ也有非常具体的仿射结构。另外,在效用J1和J2中只有终端效用而没有瞬时效用。因此,纳什均衡点,如果存在,应该是bang-bang形式的。名词bang-bang控制来自于经典的随机控制理论。在我们的情况中,当r不依赖于u的时候,这个随机微分博弈问题就会简化为一个经典的随机控制问题。bang-bang控制指的是这样一种不连续的控制,它会在某一点上有跳,并且取值于其值域的边界上。其取值会依赖于值函数的导数的正负。一个经典的形式就是Heaviside函数,正如我们这篇文章中所提到的形式。我们下面来介绍bang-bang形式的纳什均衡点。因为动力函数r是u和u的仿射结合。因此,我们实际上可以根据广义的Isaacs条件来计算出最优控制的显示形式。令H1和H2为这个博弈问题的Hamiltonian函数,也就是如下这样的不依赖于ω,从[0,T]×R×R×U×V映射到R的函数:H1(t,x,p,u,v):=pΓ(t,x,u,v)=p(f(t,x)+u+v); H2(t,x,q,u,v):=qΓ(t,x,u,v)=q(f(t,x)+u+v).现在,我们可以验证,下面的控制u和v定义在R×U和R×V上,分别取值于U和V上:(?)p,q∈R,ε∈U,ε∈V,会满足下面的广义Isaacs条件:对任意的(t,x,p,q,u,u)∈[0,T]×R×R×U×V和(∈,ε)∈U×V,我们有,H1*(t,x,p,q,ε):=H1(t,x,p,u(p,ε),v(q,ε))≥H1(t,x,p,u,v(q,ε)), H2*(t,x,p,q,ε):=H2(t,x,q,u(p,ε),v(q,ε))≥ H2(t,x,q,u(p,ε),v). (0.0.8)我们需要着重说明的是,函数H1*(resp.H2*)不依赖于ε(resp.ε),因为,pu(p,ε)=pV0 (resp.qv(q,ε)=|q|)不依赖于ε(resp.ε)。另外,哈密尔顿函数关于(p,q)是不连续的。由(0.0.7),控制对(u,v)是bang-bang形式的。然而,它们不是反馈形式的,因为还依赖于一些常数。G.J.Olsder[85]也研究过同样的不平滑的确定性的非零和微分博弈。最近确定性微分博弈相关的工作还有P Cardaliaguet and S.Plaskacz[24]。而P Cardaliaguet[23]给出了一种反馈形式的纳什均衡点的存在唯一性。然而,其效用以一种不稳定的形式依赖于终端信息。且我们不太容易将[24]的结果扩展到高维形式。不平滑的随机的微分博弈工作还有P Mannucci[80]。这篇文章运用了Hamilton-Jacobi方程体系以及相关的抛物型PDE技巧。但是在[80]中,状态过程是限制在一个有界区域中,而PDE领域中很多技巧在一个广义的区域中不是显而易见的。第4章的主要创新点在于我们给出了状态过程在广义区域上的非零和随机微分博弈问题的bang-bang纳什均衡点的存在性。并且结果可以被推广到高维的形式。但是,反馈形式的纳什均衡点的存在性还是一个未被解决的问题。像[58]一样,我们采用BSDE的方法。这个问题最终被转化为研究一个高维BSDE的问题。其生成元关于z不连续且关于z随机线性增长。在广义Isaacs条件下,我们可以证明相关的BSDE有界,从而给出了这个问题的bang-bang纳什均衡点的存在。我们的主要结论可以被总结如下:定理0.1(bang-bang纳什均衡点的存在).在假设0.2及广义Isaacs条件(0.0.8)下,存在η1,η,(Y1,Z1),(Y2,Z2)和θ,v使得:(i)η1和η2为定义在[0,T]×R到R上的两个确定性的多项式增长的可测函数;(ii)(Y1,Z1)和(Y2,Z2)为两个取值于R1+1的两对P-可测过程;(ⅲ)θ (resp.v)是一个取值于U(resp.V)的一个P-可测过程,且满足:(a)P-a.s.,(?)s≤T,Ysi=ηi(s,Xs0,x)且Zi(ω):=(Zsi(ω))s≤T为ds-平方可积的;(b)对所有的s≤T,另外,Y0i=Ji(v,v),i=1,2并且控制对(v(Zs1,θs),v(Zs2,vs))s≤T为这个非零和随机微分博弈问题的bang-bang形式的纳什均衡点。NZSDG和BSDEs之间的关系是用如摘要介绍的经典方式取得。这个关系告诉我们相关BSDE的初始值恰好为这个博弈问题的效用。另外,一旦我们说明BSDE(0.0.9)有解,并且解满足一些合适的性质,那么,NEP就是显然存在的。这是通过对进行了概率测度变换的BSDEs的解与原方程解之间的比较而取得的,同时利用了(u,司)满足广义Isaacs条件(0.0.8)的事实。因此,我们工作的重心应为证明BSDE(0.0.9)的可解性。这个方程是高维的,且其生成元关于波动过程z是不连续的。很显然,生成元的不连续性将会是本工作的一个困难。解决BSDE(0.0.9)的方法如下:(i)我们首先构造一列利普希茨连续的函数(un,un),n≥1来逼近不连续的函数(u,v)。以这列一致利普希茨函数为生成元的BSDEs列显然是有解的。另外,其解序列(Yn,zn)可以由确定性的函数(ηn,ξn)来刻画。(ii)在合适的空间上,我们给出了这些解的一致估计和函数ηn所满足的多项式增长性质。(iii)由一个弱收敛的结果,我们证明了序列ηn为柯西列。从而得到了(Yn,Zn)在适当空间上的强收敛结果。(iv)我们验证了这个强收敛序列的极限即为原BSDE的解。也就是证明我们的逼近生成元序列是收敛的。我们最终得到了,当任意的常数(ε,ε)被某个随机过程(θ,v)所取代的时候,生成元序列的子列是弱收敛到原Hamiltonian函数的。哈密尔顿函数的不连续性是在弱收敛的讨论步骤中被克服的。4.递归的马尔可夫非零和随机微分博弈第5章是与吴臻教授合作完成。这一章将会在马尔可夫框架下研究一个递归的非零和随机微分博弈(Recursive NZSDG).我们简单介绍一下问题的提出。假设有一个系统描述如下:dxt=δ(t,xt)dBt for t≤T and x0=x. (0.0.10)这个系统被两个人控制。我们用下面的弱形式的SDE来描述:dxt=f(t,xt,ut,vt)dt+σ(t,xt)dBtv,v for t≤T and x0=x. (0.0.11)过程Bu,v为新的布朗运动,是由B运用Girsanov变换得来的。过程v=(vt)t≤T及v=(vt)t≤T代表着两人施加在系统上的控制。事实上,这些控制不是免费的,会给两个人带来一定的代价。我们讨论的递归形式的代价泛函,是由下面的BSDE的初始值来定义的:对i=1,2,代价泛函定义为:Ji(v,v)=y0i,v,v对于i=1,2.这个博弈问题的目的为寻找纳什均衡点(u*,v*)满足,J1(v*,v*)≤J1(v,v*)且J2(v*,v*)≤J2(v*,v)对任意的容许控制(u,u)都成立。这实际上是说,两个人都想要最小化他们的代价,而且没有人可以通过仅改变自己的控制行为再来削减其代价。递归效用的概念已经被Duffie and Epstein[35]所考虑过。它扩展了经典的效用函数。递归形式的效用所包含的瞬时效用,不仅依赖于瞬时消费速率,而且还依赖于未来的效用。这种利用BSDEs解来描述代价泛函的方式,是受El Karoui et al.[39]的启发。递归的代价泛函可以被看做一类特殊的BSDE解的初始值。[39]讨论了一些递归效用的建立以及性质。如果函数hi不依赖于参数yi,那么代价Ji就简化为经典的结构,它为瞬时代价的积累再加上终端代价。一些递归的最优控制问题被Wang and Wu在[96]中研究过。关于递归博弈问题的研究还包括[97]。文章研究了一个零和的例子。读者可以阅读Hamadene的一系列工作来学习经典的不含递归部分的NZSDGs,例如[53,58]等。本章,我们通过BSDE的方法来研究这个递归的博弈问题,类似于Wei and Wu[97]。然而,在[97]中,状态过程的漂移函数f是有界的,或者说等价于有界的。当考虑相关的BSDE时,这种有界性是非常重要的,因为这保证了BSDE生成元关于z的利普希茨性。然而,这个假设在某种程度上讲太严格了。因此,这个工作的目的就是尽可能的放松f的有界性。我们考虑漂移函数f关于x是线性增长的情况。这种条件已经在经典的不含递归部分的博弈问题中所考虑,例如[64]及[62]。根据我们的知识,广义的含有递归部分的模型还没有被研究过。纳什均衡点的存在性等价于相关的高维BSDE的解的存在性。其生成元关于z是随机线性增长的,并且关于y有随机单调性。在广义Isaacs条件下,我们证明了相关BSDE的解的存在性,从而给出了这个递归的NZSDG问题的纳什均衡点的存在。证明BSDE (0.0.12)的解的存在性的思路为:为将区间[0,T]做一个划分。、然后首先在小区间[T-δ,T]上解这个BSDE。然后,倒向扩展到整个区间。
其他文献
"伊斯兰国"组织的崛起是中东地区内部和外部多重因素共同作用的结果。国际社会在打击"伊斯兰国"组织的行动中,各国之间的博弈很大程度上制约着打击效果,美俄在叙利亚反恐行动
湘中籼3号(原名88-140),是湖南省水稻研究所用“81-292”作母本.“矮包&#215;双36”F。作父本杂交,通过6代定向选育而成.1992年1月20日被河南作物审定委员会正式审定为推广品种,命
目的探讨沙丁胺醇联合布地奈德治疗慢性阻塞性肺疾病急性加重期(AECOPD)患者对炎性因子及肺功能的影响。方法选取2017年11月—2019年11月于我院就诊的AECOPD患者86例,按随机
现代互联网与计算机技术的发展让传统媒体手段与现代媒体手段有了更多样化的融合途径,而且现代媒体融合表现也多种多样。在媒体融合的大背景下,数字图书馆与传统图书馆的边界
导型公司之所以能保持着持续发展动力,就在于他们实施着主动寻找市场新机会的既定策略,先人一步具备满足用户新需求的能力。借Mentor Graphics“EDATech Forum2009”上海站举办
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
《浙江省教育厅关于切实减轻义务教育阶段中小学生过重课业负担的通知》中明确规定:严格控制学生作业量,教师要精心设计作业,坚决杜绝给学生布置机械性、重复性、难度过大的