有限时间ADP算法的若干问题研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:hutuxiaoshenxian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自适应动态规划(Adaptive dynamic programming, ADP)是求解非线性系统最优控制的有效方法。近年来,为了实现非线性系统的有限时间最优控制,一种新的有限时间ADP算法被提出。然而现有的有限时间ADP算法需要已知一步容许控制序列,并采用BP网络实现。本文针对该算法的不足以及BP网络的缺点,研究了有限时间ADP的改进算法及其回声状态网络(Echo state network, ESN)实现,并将改进算法用于求解输入含死区和跟踪控制问题。主要研究工作及结论如下:1.现有的有限时间ADP算法要求被控系统一步控制到零,即已知一步容许控制序列,这一条件限制了该算法的应用。针对现有算法的不足,本文提出了两种改进思路,分别命名为改进算法1和改进算法2。改进算法1需要已知初始容许控制序列,但序列长度任意,去掉了原算法序列长度为1的限制。改进算法2无需初始容许序列,它的初始代价选取与容许序列无关。在给出两种改进算法的迭代过程后,严格证明了改进算法1和2的收敛性。为了实现有限时间控制,引入误差限ε,推导出ε-最优控制,并证明它的近似最优性。2.讨论了ADP算法神经网络实现的收敛性。以改进算法2为例,分别对评价网络近似误差和双网络近似误差进行分析。在满足某些假设条件时,证明了神经网络近似代价序列能够收敛到理论最优代价的有界邻域。仿真算例说明所提出的收敛性分析方法是有效的。3.针对输入含对称死区的非线性系统,使用改进算法1求解有限时间最优控制问题。首先构造新的效用函数形式处理死区,其次在改进算法1的结构图中,引入死区网络对死区进行辨识。最后通过仿真实验证明了改进算法1能够有效处理死区约束。4.以改进算法2为基础提出了有限时间优化跟踪控制方案,并采用ESN实现。模型、执行和评价ESN的输出权值均采用LM算法调整。仿真实例验证了所提出的跟踪控制方案的有效性。
其他文献
报警管理系统是用来对工业生产过程中的异常状况进行实时检测并生成提示信息,操作员依此对异常工况进行干预和处理,从而降低生产过程中事故发生率,提高工厂生产效率和安全性。 
多智能体系统编队控制问题,在近十年来,已经获得了国内外的研究学者的高度关注。编队控制问题,在生物群体行为形成机理研究、工程实践和军事应用等诸多领域中,已经形成了一门
国内外针对电子式互感器技术的研究与应用已有多年历史。上世纪八十年代开始国外有相关产品面世并投入使用,国内对电子式互感器的研究起步较晚,但随着研究的投入和技术发展,相关产品相继面世,实际挂网运行也已有十多年的历史。在这期间积累了大量的使用经验,也暴露出了很多问题和缺陷,这为电子式互感器技术的发展指明了方向。针对电子式互感器的研究现状和在实际应用中出现的问题,结合理论分析发现电子式互感器是一个具有动态
多姿态人脸检测与跟踪技术是计算机视觉与模式识别领域重要的研究热点,在视频会议、人机交互、图像检索,智能监控等方面有着巨大的应用前景。然而其检测的准确性和实时性仍是
随着社会和高新科技的高速发展,航天事业成为衡量一个国家综合国力的重要指标,逐年增加的航天发射任务数量对传统依靠手工和经验编排航天发射任务的模式产生了巨大冲击,航天
活性污泥过程是一个伴随着物质和能量的转换和传递的动态生化反应过程。由于受到污水处理过程中多变量、大时滞、强干扰和动态非线性等特征的影响,传统的控制策略往往难以获得令人满意的控制效果。此外,污水处理过程中还存在一些难以直接测量的重要参数,严重制约着污水处理控制系统自动化水平的提高。因此,研究新型智能优化控制算法不仅仅能丰富复杂过程的智能优化控制方法的理论意义,还能对污水处理系统的建模、智能控制器设计
电化学分析作为一个热门的研究领域正越来越多地引起诸多国家的注意。随着电化学分析理论的持续发展,在很多的实验室以及工控现场,基于各种电化学分析方法而研制的电化学工作站,已经成为了电化学测试、分析、处理的重要设备之一。随着数字电路及数字信号处理技术的日趋成熟,传统模拟的电化学测试设备逐渐被数字化的电化学工作站所取代。本文针对于电化学测试信号的特点,研究电化学工作站的信号采集技术,设计电化学工作站采集模
随着能源、环境问题的日益白热化,电能在能源市场中所占的比重越来越大,尤其是以可再生清洁能源,如风能,太阳能等发电方式组成的微网系统的发展取得了一定成果。而控制问题是微网研究中的核心方面,各种针对微网的控制理论应运而生,但是,大多数的控制研究仅限于软件仿真阶段,并没有实际的运行条件,于是建立微网实验系统,为微网的研究提供实物验证平台也成了对于微网研究迫在眉睫的问题之一。本文便是在这样的背景下,基于国
射频识别(Radio Frequency Identification,RFID)技术是一种自动识别技术,具有非接触识别、可重复读写及环境适应能力强等特点,被广泛应用于身份识别、物流管理、交通控制、
流程管理,是对企业流程、组织结构以及IT技术的整合与应用。包括对流程的分析、模型的建立、任务的调度、资源的分配、评测、再优化等。以业务流程为中心,以提高企业业务绩效