基于策略迭代的线性奇异摄动系统自学习最优控制

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:king_8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
奇异摄动系统是一类快、慢动态耦合的双时间尺度系统,广泛存在于电力系统、化工过程、机器人等领域。现有奇异摄动系统最优控制方法主要局限于模型参数已知的情况。自适应动态规划是一种可以在模型完全未知下设计最优控制器的自学习技术,已经广泛用于解决弱耦合、双线性、交联等复杂系统相关最优控制问题。由于共存的快、慢现象,现有自学习最优控制方法直接应用到模型未知的奇异摄动系统上会导致“病态数值问题”。因此,本论文面向模型未知的线性奇异摄动系统,把自适应动态规划方法和系统的双时间尺度结构特点相结合,研究基于策略迭代的自学习最优控制方法,目标是克服常规自学习控制方法的“病态数值问题”,提出良性的在线学习算法。主要工作概括如下:1.针对模型未知的线性奇异摄动系统最优状态调节控制问题,设计一种基于策略迭代的在线学习算法。首先,基于代价函数参数矩阵解的结构特点,重构传统Kleinman算法涉及的Lyapunov方程,提出一种改进的Kleinman算法;其次,根据积分贝尔曼方程和系统双时间尺度特性,设计一种基于数据的良性在线策略迭代算法;然后,在分析两种算法等价性的基础上证明所提在线算法的收敛性与闭环系统的稳定性;最后,通过仿真验证所提方法具有更好的鲁棒性。2.针对模型未知的线性奇异摄动系统混合H2/H控制问题,设计一种基于策略迭代的在线学习算法。首先,基于代价函数参数矩阵解的结构特点,重构递归迭代算法所涉及的Lyapunov方程组,提出一种以任意稳定反馈增益为初始条件的离线算法;其次,利用实时测量的数据,设计一种良性的在线策略迭代算法;然后,分析所提在线算法的收敛性与闭环系统的稳定性;最后,通过数值仿真验证所提方法的可行性。3.针对模型未知的线性奇异摄动系统最优输出跟踪控制问题,设计一种基于策略迭代的在线学习算法。首先,构造由参考轨迹和原系统组成的增广模型,将跟踪问题转换为增广系统的调节控制;其次,设计一种基于数据的良性策略迭代算法,同时学习前馈和反馈控制增益矩阵;然后,证明所提在线算法的收敛性与闭环系统的稳定性;最后,通过一个直流电机系统的仿真例子验证所提方法的有效性。
其他文献
突发性强降雨天气发生的频率越来越大,暴雨洪涝灾害及其诱发的滑坡泥石流灾害已经成为我国最主要的自然灾害,每年因暴雨洪涝灾害和滑坡泥石流灾害产生严重的经济损失和人员伤亡。利用径流汇流模型模拟强降雨径流汇流过程对有效降低暴雨洪涝灾害造成的损失具有重要的意义。分布式水文模型模拟结果能够反映全流域径流汇流结果,成为当前应用最广泛的径流汇流模型。影响分布式水文模型的模拟精度主要有两个因素,一是模型基础数据精度
植物是大自然中生物活性物质富集的宝库,其中抑菌活性物质在植物中分布广泛。人们在植物中研究得出有抗菌生物活性的有效成分种类很多,主要有黄酮类、皂苷类、有机酸、甾类、
当前,在我国社会发展速度不断加快的过程中,国家的经济和科技水平得到良好的提升,在这样的背景下,人们逐渐开始意识到,人才培养所具有的重要性。校园教学工作不仅仅需要关注
本文中,运用变分方法研究如下Chern-Simons-Schrodinger系统其中(?),x=(x1,x2)∈R2,Aj:R2→ R,(j.=0,1,2)是规范场,非线性项f∈C(R2×R,R).我们对非线性项f提出如下假设(f1)f
轻钢组合结构住宅体系主要由冷成型钢骨架与轻质建筑板材组成,具有外表美观、绿色环保、施工方便、便于实现建筑装配化等特点,普遍适用于低层别墅住宅。随着我国城镇化快速发展,将低层轻钢组合结构住宅体系拓展为多层轻钢组合结构住宅体系,不仅能够提高土地利用率,而且能够解决我国钢铁产量过剩问题。在此拓展过程中,轻钢组合结构的耐火性能是重点需要解决的问题。本课题组已完成多种不同形式的轻钢组合构件高温火灾试验,本文
本文采用水热法以葡萄糖为原料合成了碳微球(CMSs)和功能化碳球CMSs-Fe、CMSs-Cu、CMSs-Zn、CMSs-Y,并将它们通过溶液共混法与TPU混合制成TPU/碳微球、TPU/功能化碳球母粒。T
近几年,人们对CO2的减排和再利用愈加重视。其中,利用CO2能够有效地提高石油采收率(EOR),在CO2埋存和油藏增产有着广阔的应用前景。而CO2泡沫驱因其具有的流度比可控、调剖驱油
富营养化水源地水体常发生蓝藻水华,其释放的微囊藻毒素已威胁饮水安全。微囊藻毒素-LR(microcystin-LR,MC-LR)污染最普遍,且毒害性最强,对其进行无害化降解备受关注;溶解性
中国经济的高速发展带来了巨大的环境成本,雾霾污染问题愈发严重,由于雾霾污染所引起的公共健康风险以及经济损耗日益严峻,治理雾霾仍然将是当前我国实现经济社会可持续发展
卡枯醇是从马兜铃科植物杜衡(Asarum forbesii Maxim)中提取的主要成分,因其结构简单,结构修饰和改造潜力大,有作为药物合成先导化合物的可能。根据文献报道和课题组的前期研究