论文部分内容阅读
随着科技时代的发展,四旋翼的广泛适用性特点逐渐显著,能够加装摄像头,吊索,机械手等扩展到各行各业,从事各种危险人力所不及的工作,可以预见在不久的将来需要其能够参与到更加复杂的任务中。四旋翼多输入多输出的复杂控制机制使得其在复杂环境下进行精确的任务控制是有难度的,尤其需要控制其与外界物体进行互动更加具有难度,例如空中更换电池物品等。为了满足这种复杂控制需求,本文研究了四旋翼和倒立摆组合平衡控制系统,深入分析平衡条件和控制方法,设计仿真实验平台,以四旋翼为驱动平台控制倒立摆平衡,利用强化学习算法完成倒立摆在空中的接力仿真实验。本文主要研究工作包含以下几个方面:(1)分别从四旋翼和倒立摆两方面建立数学模型,根据两者的动力学关系建立四旋翼倒立摆系统模型并进行必要的简化处理,构建两者的控制输入关系和控制条件,得到只要根据改变四旋翼的姿态角就可以对倒立摆进行平衡控制的结论,减小的复杂系统的控制难度,便于后续实验过程分析。(2)分别建立了旋转坐标系具体分两种情况设计四旋翼倒立摆平衡环境,得到定点悬停、圆周运动的平衡条件,并使用线性二次型控制器在设计的仿真实验平台进行仿真,实现了四旋翼倒立摆系统的平衡控制,为后续接力实验提供了基础条件。(3)对四旋翼倒立摆系统的接力过程分解设计,对倒立摆轻杆设计不同的运动状态,从能量转换的角度分析了不同状态的接杆条件,推导了杆运动公式和接杆时机,分析满足四旋翼能够接到的速度姿态条件,并根据第一性原理和简化原则对四旋翼的抛杆动作进行设计,得到轻杆运动曲线;据此对四旋翼接杆方法进行设计,采用变加速度方法控制四旋翼机动,并得到四旋翼接杆预测路径,通过仿真验证了预测路径可行性与可靠性。(4)确定了接杆跟踪路径的曲线描述,引入策略梯度强化学习算法设计控制学习策略、网络参数得到多组训练模型,使用基于深度策略梯度强化学习算法,进行四旋翼八字控制训练,对数据分析得到很好路径跟随效果,将训练好agent应用于接杆实验,并通过仿真验证了路径跟随效果,完成了对倒立摆轻杆的接力实验,表明了设计的控制算法验证平台满足对四旋翼倒立摆复杂控制的需求,验证了整个系统设计的可行性,对未来控制仿真领域有一定的积极意义。