强化学习方法在自主水下机器人控制任务中的应用

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户:yaoyao2048
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,强化学习方法得到了广泛的关注,并已在控制领域取得了一定成果.自主水下机器人(AUV)能完成复杂多样的水下任务,是海洋探索开发任务中的关键设备,强化学习技术的发展为AUV的智能化控制提供了新的思路.本文着眼于强化学习与AUV控制的交叉领域,重点介绍了强化学习在镇定控制和跟踪控制等底层控制任务方面的应用.为此,我们首先对强化学习框架进行了简要介绍,并在其后对强化学习在AUV控制领域面临的挑战以及最新的进展进行了概述.最后,我们详细介绍了两种针对AUV的无模型强化学习控制方法,希望能够为此类控制器
其他文献
土质水分和温度是造成桥涵基础冻害的基本因素,因此也是防治其冻害的关键,本文简要介绍了几种防治桥涵基础冻害的措施。 Soil moisture and temperature are the basic fact
本文提出了一种新型多模SRLR (square ring loaded resonators)结构,并基于该谐振结构设计了一款具有高共模噪声抑制的双通带超导平衡滤波器.此外,本文详细地给出了该谐振器的差共模谐振机理,拓扑结构,模拟仿真结果.基于上述分析,使用0.5 mm厚度的氧化镁(MgO)基片上的钇钡铜氧(YBCO)高温超导薄膜设计制作一款四阶双通带平衡滤波器,该滤波器的两个通带的中心频率分别为
虽然课程标准将“证据推理与模型认知”作为化学核心素养,但教师在促进中学生化学模型能力发展方面的教学现状不尽人意,一方面因为教师对“模型认知”的教学意义认识不到位,
这里是中国黑龙江省的东部地区。 千百年来,蜿蜒千里、奔腾呼啸的黑龙江、松花江、乌苏里江以其移山填海般的伟力冲积成了三江平原沃野。佳木斯就坐落在这三江平原的腹地上,
目的 目前丙泊酚和依托咪酯是MECT治疗中广泛使用的两种麻醉药物,但两者对MECT治疗指标的影响及治疗中的不良反应并不相同,国内外多个研究对两者进行了比较,但结果并不完全一
会议
学习源于兴趣,兴趣是获取知识的内驱力,同时也是学生进行学习的最大动机,它影响着学生的学习行为与效果.中学生物教学中,激发、调动学生学习兴趣的形式和方法手段很多,如野外
细胞神经网络(cellular neural network, CNN)具有简单的局部互联结构和高速并行处理能力,是构造人工视网膜的基础模型,可被应用于机器视觉中图像处理时的图像增强等方面.然而,现有的此类图像增强方法尚存在一些不足,例如,在处理实际复杂图像时,采用固定模板难以取得理想效果;而且,未能模拟人类视觉系统的全局和局部自适应调节特性,缺乏仿生考虑.因此,本文融合自适应三高斯(tri-Ga