论文部分内容阅读
由于多智能体系统一致性控制在工程领域中的广泛应用,得到越来越多研究者的关注,最优一致性控制作为其中的一个热点研究方向也吸引着众多的学者。在实际应用中,多智能体系统存在复杂和不可知的因素,使得系统动力学模型难以完整获取。因此,具有未知动力学模型的多智能体系统的最优一致性研究存在重要的实际价值。然而,大量的数据传输和计算对于体积和计算量有限的智能体来说是个很大的负担,因此如何在确保达到一致的同时,减少智能体之间的数据传输是许多学者面临的挑战。事件触发控制提供了一种解决智能体之间频繁通信的有效方法,尤其是基于边的事件触发控制。本文分别利用一般的事件触发控制和基于边的事件触发控制解决离散时间和连续时间的未知多智能体系统的最优一致性问题。本文主要的研究内容如下:1.基于事件触发的离散多智能体系统最优一致性问题的研究。对于未知动力学模型的多智能体系统的最优一致性问题,一般通过采用哈密尔顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman,简称HJB)方程来求解最优控制,从而解决最优一致性问题。将强化学习和控制理论相结合,提出一种新型的策略迭代算法用于近似得到HJB方程的解。利用HJB方程,设计事件触发控制条件,当违反条件时候,才对神经网络进行训练,对系统进行迭代更新。通过仿真实验进行证明,相比较于传统的算法,结果的收敛速度得到加快;与没有事件触发相比较,系统没有连续不断地进行更新,使得在达到一致性的同时,降低了计算负载。2.基于边缘事件触发的多智能体系统最优一致性问题的研究。基于邻居的事件触发方法,在每一次的事件触发时刻,智能体要获取所有邻居智能体的信息。因此,这其中难免存在不必要的信息,导致增加计算负载和数据冗余。与基于邻居的事件触发控制方法从智能体出发不一样,边缘事件触发方法是从智能体与智能体之间的连边出发,利用边缘的信息构建得到的HJB方程,设计边缘事件触发的条件。在边缘事件触发时刻,智能体只会得到通过这条边相连的智能体的信息。通过仿真实验对边缘事件触发控制方法的有效性进行了证明。