强化学习方法在自主水下机器人控制任务中的应用

来源 :中国科学:信息科学 | 被引量 : 0次 | 上传用户：yaoyao2048

【摘要】

：

近年来,强化学习方法得到了广泛的关注,并已在控制领域取得了一定成果.自主水下机器人(AUV)能完成复杂多样的水下任务,是海洋探索开发任务中的关键设备,强化学习技术的发展为AUV的智能化控制提供了新的思路.本文着眼于强化学习与AUV控制的交叉领域,重点介绍了强化学习在镇定控制和跟踪控制等底层控制任务方面的应用.为此,我们首先对强化学习框架进行了简要介绍,并在其后对强化学习在AUV控制领域面临的挑战以

【作者】

：

许雅筑武辉游科友宋士吉

【机构】

：

清华大学自动化系与北京信息科学与技术国家研究中心,北京100084

【出处】

：

中国科学:信息科学

【发表日期】

：

2020年12期

【关键词】

：

强化学习自主水下机器人底层控制自主控制无模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

桥涵基础冻害的防治措施

土质水分和温度是造成桥涵基础冻害的基本因素,因此也是防治其冻害的关键,本文简要介绍了几种防治桥涵基础冻害的措施。 Soil moisture and temperature are the basic fact

期刊

硬质泡沫塑料冻胀沥青砂冻害季节性冻土填砂分层回填冻结深度冻土地区多年冻土地区

社区慢性精神分裂症病人综合干预研究

会议

社区慢性精神分裂症病人综合

基于新型SRLR结构的双通带超导平衡滤波器研制

本文提出了一种新型多模SRLR (square ring loaded resonators)结构,并基于该谐振结构设计了一款具有高共模噪声抑制的双通带超导平衡滤波器.此外,本文详细地给出了该谐振器的差共模谐振机理,拓扑结构,模拟仿真结果.基于上述分析,使用0.5 mm厚度的氧化镁(MgO)基片上的钇钡铜氧(YBCO)高温超导薄膜设计制作一款四阶双通带平衡滤波器,该滤波器的两个通带的中心频率分别为

期刊

多模SRLR双通带平衡滤波器共模噪声抑制高温超导

促进高中化学模型认知能力进阶发展的策略

虽然课程标准将“证据推理与模型认知”作为化学核心素养,但教师在促进中学生化学模型能力发展方面的教学现状不尽人意,一方面因为教师对“模型认知”的教学意义认识不到位,

期刊

模型教材课标高考试题思维导图

齐拉西酮与奥氮平治疗精神分裂症的一年随访研究

会议

齐拉西酮奥氮平治疗精神分裂症

佳木斯—通向太平洋的“大陆桥”

这里是中国黑龙江省的东部地区。千百年来,蜿蜒千里、奔腾呼啸的黑龙江、松花江、乌苏里江以其移山填海般的伟力冲积成了三江平原沃野。佳木斯就坐落在这三江平原的腹地上,

期刊

移山填海乌苏镇中国黑龙江省俄罗斯远东地区三口同江市对外贸易史江海联运边境旅游申国

改良电休克治疗中丙泊酚与依托咪酯对照研究的系统评价

目的目前丙泊酚和依托咪酯是MECT治疗中广泛使用的两种麻醉药物,但两者对MECT治疗指标的影响及治疗中的不良反应并不相同,国内外多个研究对两者进行了比较,但结果并不完全一

会议

初中生物实施兴趣教学的策略

学习源于兴趣,兴趣是获取知识的内驱力,同时也是学生进行学习的最大动机,它影响着学生的学习行为与效果.中学生物教学中,激发、调动学生学习兴趣的形式和方法手段很多,如野外

期刊

初中生物学习兴趣教学策略

康复治疗对住院慢性精神分裂症患者个人和社会功能疗效

会议

康复治疗住院慢性精神分裂症患者社会功能

用于图像增强的仿生自适应忆阻细胞神经网络

细胞神经网络(cellular neural network, CNN)具有简单的局部互联结构和高速并行处理能力,是构造人工视网膜的基础模型,可被应用于机器视觉中图像处理时的图像增强等方面.然而,现有的此类图像增强方法尚存在一些不足,例如,在处理实际复杂图像时,采用固定模板难以取得理想效果;而且,未能模拟人类视觉系统的全局和局部自适应调节特性,缺乏仿生考虑.因此,本文融合自适应三高斯(tri-Ga

期刊

细胞神经网络图像增强自适应三高斯模型仿生图像处理忆阻器

强化学习方法在自主水下机器人控制任务中的应用

与本文相关的学术论文