学习辨识策略与若干类系统的学习控制

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:passiionlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际中常见的重复系统多表现为在有限区间上重复运行,或执行周期轨迹跟踪任务的动态系统。学习控制的提出,为处理这类系统提供了一条途径。现有的方法大多要求被学习量为一定常量,而学习控制方法允许被学习量随时间轴变化,甚至突变。本文讨论重复系统的辨识与控制问题,给出时变参数的学习辨识算法,并进一步地设计学习控制器。最后讨论了带有初始偏差的迭代学习控制问题,并给出具体的学习控制算法。本文展开了如下的研究工作:1.针对重复时变系统,基于“不变量原理”提出学习辨识方法用于估计系统的时变参数。讨论了有限区间上重复运行的时变系统和周期时变系统的两种情形。给出最小二乘学习算法的推导过程,并分析了所提算法的收敛性。结果表明,当重复持续激励条件成立时,提出的学习辨识算法具有重复一致性,能够给出时变参数的完全估计。为进一步加快参数收敛速度,考虑将沿时间轴方向的多步新息与沿迭代轴方向的多重新息结合起来,以期提高参数估计精度。数值结果验证了所提算法的有效性。2.针对离散周期时变系统,提出自适应反演重复学习控制方法。采用重复学习最小二乘算法估计系统中的时变参数,为防止控制器设计中可能产生的奇异性问题,引入控制增益的估计下界。为分析所提学习算法的收敛性,将离散自适应系统中常用的关键技术引理进行推广,给出一种迭代域关键技术引理形式。理论分析和数值结果验证了所提算法的有效性。3.讨论连续/离散非线性时变系统的特征建模,统一采用一阶时变差分方程做为特征模型。对于建模中可能产生的快变亦或突变的模型参数,以学习辨识方法进行估计;利用参数估计值设计自适应迭代学习控制器,实现轨迹跟踪任务。参数估计学习算法包括带有遗忘因子的最小二乘学习算法和梯度学习算法。数值算例和电机位置跟踪实验结果表明所提的特征建模方法和学习控制方案的有效性。4.讨论迭代初态与期望初态存在固定偏移情形下的迭代学习控制问题,提出带有反馈辅助项的PD型迭代学习控制算法,可实现系统输出对期望轨迹的渐近跟踪。为了进一步实现输出轨迹在预定有限区间上对期望轨迹的完全跟踪,提出分别带有初始修正作用的PD型和PID型的学习算法。文中给出所提出的学习算法的极限轨迹,并对学习算法进行收敛性分析,推导出收敛性充分条件,可用于学习增益的确定。通过数值结果,验证所提学习算法的有效性。
其他文献
游南京的人,不逛夫子庙,不去瞻仰庙里的孔夫子,是不多的:逛夫子庙,看秦淮风情,不吃东西的人,恐怕也是不多的.
本文以Martin等人创立的评价理论为基础,采取定性与定量相结合的研究方法,从情感、判断和鉴赏三方面比较中美慕课写作课程的态度资源。研究发现,在情感和判断方面,美国慕课话