论文部分内容阅读
为了保证无人机的操作简便与解放人力的目标,提高为多旋翼无人机提供长期任务所需的自主水平,无人机在完成既定作业之后在回收平台上的自主降落操作就成为了研究的热点问题。由于回收平台大多是机动的,无人机移动平台上的自主降落成为了亟待解决的问题。本文的主要目的是通过机器学习机制来控制无人机解决其在地面移动平台的降落问题。针对现实世界中无人机学习训练的可重复性差和高危险性的问题,采用Parrot公司的Bebop2作为无人机单元并使用该公司的Sphinx环境下进行模拟,搭建了一套基于Gazebo-Parrot和ROS的无人机学习模拟仿真平台,该平台在Ubuntu/Linux操作系统下运行。通过该平台,实现了无人机在仿真环境下的学习训练,解决了实物训练的可重复性差和危险性高的问题。本文同时对深度强化学习算法的发展背景以及其中的部分算法的具体原理和其中的详细细节进行了具体的阐述,分析了各个算法的优缺点以及如何选择和应用深度强化学习算法在无人机在移动平台降落的具体任务目标上。针对平台和UAV的互相感知,本文提出了两类具有高可操作特点的方案:外部辅助和机器视觉。其中外部辅助在仿真中由Gazebo模拟器来替代,并对机器视觉方案进行了理论论证和细节说明,用以解决现实世界中可能不存在外部设备来提供降落相关数据的问题。同时,根据平台的不同移动条件,本文设计了四种不同状态条件的移动平台并设计了传统控制器来和学习算法进行对比。由于在仿真程度较高,物理引擎完备的Gazebo平台下进行模拟,本方案同时具有较强的现实世界操作的可移植性。