论文部分内容阅读
本文介绍了一种基于动作依赖型自适应动态规划方法的新型实时优化神经控制器,包括其原理结构,训练算法和实现步骤。
该方法能够提高计算效率,并且利用动作-评价结构克服“维数灾”问题。评价网络是用来近似动态规划方法的代价函数。动作依赖型(Action Depended)算法使得ADP控制器更加简单,更适合于复杂非线性系统的在线/实时控制。
一种算法的计算复杂性、实时性等特性是其能否成功应用的关键。基于AD-ADP的神经控制器能够解决不确定非线性问题,特别是难以建模系统,同样可以很好的降低由于缺乏必要的先验知识给控制系统设计带来的困难。
由于动作依赖自适应动态规划方法的结构在控制上有着特殊的优势,本文在实时性分析的基础上分别选取并设计了ADHDP和改进型ADDHP算法的控制器。
为了说明该方法对于复杂非线性系统在线优化控制的效果,选取三容液位系统作为控制对象,一种强耦合非线性多变量系统,是用来验证各种控制算法的有效装置。在IPC、MATLAB和PCI1710平台上,分别进行了基于AD-ADP的仿真和实时控制实验。
实验结果及其比较可以看出这种基于AD-ADP的新型优化神经控制器有强鲁棒性,强抗干扰性,控制精度高以及反应迅速等特点。显示了AD-ADP控制器,这种智能无模型控制方法在复杂非线性在线/实时控制上的优势,特别是在模型不确定系统控制的优势。相信该方法的发展和实际工业应用的前景是广阔的。