平均场随机控制与动态博弈相关问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:maiapink
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
平均场随机控制(Mean Field Stochastic Control)是指基于平均场交互的多维可控状态过程和目标泛函下的随机控制问题。作为一类重要的平均场随机控制问题,平均场博弈(Mean Field Game)考虑大规模参与者具有平均场交互动态系统的微分博弈问题。处理平均场随机控制和博弈的核心方法是通过研究代表性参与者的一维控制问题来构造有限系统的逼近Nash均衡,从而克服在计算均衡策略时遇到的维数困境。基于此,平均场随机控制,特别是平均场博弈已经在金融经济、传染病学、供电网络、5G通信和人群动力学等领域得到了广泛的应用。本文通过发展随机分析、随机控制和动态微分博弈的理论和方法,研究关于随机经济增长、产品粘性价格和银行拆借网络的平均场随机控制的最优中心化策略以及平均场博弈的Nash均衡等相关问题。具体的研究内容、所采用的研究方法和研究结果陈述如下:第3章研究了基于Cobb-Douglas生产函数和随机增长模式下的金融网络最优消费的平均场博弈问题。我们引入平均场形式的Poisson过程来建模外生市场信息对金融网络中个体机构财富过程的冲击。在跳-扩散平均场交互的受控财富动力学和最大化期望累积消费与终止平均财富的常数绝对风险厌恶效用下,我们建立一个“代表性”机构的最优消费问题(即交互网络中个体机构数量趋于无穷时的极限随机控制问题),通过动态规划原理和HJB(Hamilton-Jacobi-Bellman)方程得到其最优反馈消费策略。再利用平均场理论的一致性条件(Consistence Con-dition)推导相应的不动点问题,并应用 Shauder 不动点理论刻画不动点问题的适定性。基于此,根据“代表性”机构的最优反馈消费过程建立交互系统的动态消费策略,我们证明其是有限消费网络的逼近Nash均衡。第4章研究了在价格粘性以及由于突发事件导致的市场激增需求下,产品生产网络中最优生产率动态调节的平均场博弈问题。价格粘性是指在市场经济下,产品的价格不易发生变动的一种现象,其可以通过逆需求价格与实际价格的差来刻画。对于激增需求(Surging Demand),我们用平均场交互的Poisson过程来建模不同突发事件发生而引起的产品需求激增,因此导致的产品价格上升。在跳-扩散平均场交互的受控商品产量-价格动力学和最大化期望累积净收益下,我们考虑“代表性”企业产品生产率动态调节的随机控制问题,通过动态规划原理和HJB方程研究其最优产量调控策略。对于一致性条件所对应的不动点问题,我们将其转化为以在“代表性”企业最优生产率调节策略下的期望价格函数、期望生产率函数和期望生产率调节函数为解变量的确定性耦合微分方程系统的适定性。通过解析求解该耦合系统和利用”代表性”企业的最优反馈生产率调节函数来建立产品生产网络的动态产量调节策略,我们证明其是有限产品生产网络的逼近Nash均衡。第5章研究了中央银行通过诸如改变货币供应量等方式来动态控制银行拆借网络中个体银行的现金储备与目标阈值的平均-平方损失的最小化问题。不同于平均场博弈,该问题是一个基于网络的中心化随机控制问题。为了证明当银行平均场交互网络中个体银行数量趋于无穷时,网络的目标泛函和相应最优中心化控制策略的收敛性,我们首先探讨有限银行网络的中心化控制,建立强形式和弱形式下值函数的等价性。在弱形式下,我们通过证明一类随机Fokker-Planck-Kolmogorov(FPK)方程的适定性来刻画银行网络极限目标泛函。进一步,利用凸分析、随机最大值原理、Wasserstein度量下概率测度的收敛和Gamma收敛来证明有限网络的中心化弱形式控制策略的确收敛到极限随机控制问题的最优控制策略。
其他文献
随着5G时代的到来,信息技术更加全球化、多媒体化,移动数据也呈现爆炸式增长。在此背景之下,用于保存和处理信息的器件——存储器,也面临着更大的挑战。目前,传统的半导体存储器已经逐步逼近发展极限,亟需研究和开发出存储密度更大、响应速度更快、存储寿命更长、可靠性更好、成本低廉和易于加工的存储技术和存储材料。另一方面,当电子器件或半导体器件的密度过高时会在局部产生热点,造成器件的毁坏和能源的浪费。因此,在
在本文中,首先研究了带随机因子影响的保险公司资金的最优投资和风险控制问题。在该模型中保险公司可以将其财富分配给风险资产和无风险债券,其中风险资产价格的波动率和利率都依赖于环境的随机因子。保险公司的风险过程由一般的跳-扩散风险过程建模,并且风险过程的跳描述为具有状态依赖跳测度的泊松随机测度。保险公司的目标是通过选择最优的资产投资策略和风险控制策略,从而最大化其终端时间财富的期望效用。论文的第一部分主
界面调控因为在生产生活中有着非常重要的应用价值,越来越受到研究人员的重视,例如结构色可以用于识别码、装饰美化、防伪等领域,超疏水低粘附的表面可以用于防污、抗冰、自清洁等领域,基于表面张力梯度的自驱动可以用于机器人、发电等领域。这些独特的界面现象本质上都是微纳结构对界面物理性质的调控而产生的,因此对微纳结构的可控加工进一步成为研究的热点。目前,虽然各种各样微纳结构已经成功地通过多种微纳加工技术被制备
纳米材料的发明、器件结构的微型化和微纳米加工工艺的发展,使高分辨率、精确而且便捷的测量方法成为必要。作为具有纳米分辨率的扫描探针技术,原子力显微术由于样品制备简单、工作环境多样、无损检测等优点而得到广泛使用。多种基于原子力显微术的工作模式得到发展,并应用于测量包括电导率、磁导率、力学强度等的样品局域特性。其中力学特性的精确表征是纳米尺度材料和器件研究的重要需求,以接触共振原子力显微术为代表的纳米力
互联网的蓬勃发展带来了海量的文本内容,分析和归纳这些文本内容是常见的任务。其中,主题模型是一种分析文本内容的常用方法。这类方法通过构造一个关于文本、主题和词语作为随机变量的联合概率分布,并估计概率分布中参数,最终得到文本和主题以及主题和词语之间的概率关系。主题模型得到的联合概率分布,被广泛用于如搜索引擎、知识图谱、广告推送、舆情监控等应用领域。近些年来,微博、脸书等社交媒体的广泛使用,让短文本成为
细胞内的亚细胞结构在生命活动中扮演着重要的功能角色,其形态功能的研究对于解析生命过程和重要疾病的发生具有重要意义。目前对亚细胞结构的动态研究依赖于荧光标记技术,但引入了荧光染料的光漂白和光毒性对细胞造成的额外压力,导致其进行活细胞长时间动态过程研究的困难。近些年发展的基于相位的无标记成像能够成功地可视化这些亚细胞结构而不会对其正常的生理状态造成干扰,但也由于其无标记特性而缺乏特异性,很难对于特定的
随着物联网的强势发展,各种新型物联网应用与技术手段层出不穷。其中,两方面的技术发展引起了人们的广泛关注。一方面,无源反射通信技术的出现极大降低了通信能耗,打破了能量瓶颈限制物联网发展的局面。另一方面,基于物联网的行为感知技术有效扩展了物联网技术的应用场景,成为万物互联的重要环节。本文的工作将这两方面的研究进行有机结合,实现基于无源反射技术的人体行为感知与身份认证。本文的工作无需增加额外设备,仅以无
表面增强拉曼散射(SERS)具有不同于传统检测技术的独特优势,比如水的干扰小、检测过程简单快捷、样本处理要求低且能提供分子指纹图谱等,从而被大量应用于生物医学分析、化学反应监测、物理表征等诸多领域。尽管如此,SERS技术在实际应用过程中仍面临一些问题,比如基底的检测性能低于预期、普适性差、成本高等。其中,基底检测性能的优化是SERS技术中亟需解决的关键问题,这通常与基底的灵敏度密切相关。目前,提高
随着自由曲线曲面造型技术的日渐成熟,非均匀有理B样条(NURBS)已经成为工业产品几何形状的标准表示。等几何分析(IGA)把用于表示几何的基函数用于分析,避免了传统有限元(FEA)耗时的网格化。由于NURBS网格的张量积结构,几何建模中会引入大量的多余控制点,并且基于NURBS的IGA无法对曲面进行局部细分,于是出现了很多定义在T网格上的可局部细分样条。在实际应用中,常常需要对三维实体进行建模和分
视频已经成为大数据时代最重要的信息载体之一。相比静态图像,动态视频包含更多的视觉信息和听觉信息,更为复杂多义,所以对视频处理、分类、推荐等常见视频相关任务提出了更高的要求。人体动作识别一直以来是视频理解中最重要的课题之一。它可以应用到虚拟现实、人机互动、智能监控和视频检索等领域中,还可服务于短视频、直播平台、视频网站等相关应用,为视频个性化推荐、舆情监控、广告投放等业务提供技术基础。在视频中,人体