基于强化学习的机器人曲面恒力跟踪研究

来源 :浙江大学学报(工学版) | 被引量 : 0次 | 上传用户:yumeng88888888888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对机器人末端执行器和曲面工件接触时难以得到恒定接触力的问题,建立机器人末端执行器与曲面工件的接触模型.构建曲面接触力坐标系与机器人传感器测量坐标系之间的关系,利用基于概率动力学模型的强化学习(PILCO)算法对模型输出参数与接触状态的关系进行学习,对部分接触状态进行预测,强化学习根据预测的状态优化机器人位移输入参数,得到期望跟踪力信号.实验中,将强化学习的输入状态改为一段时间内的状态平均值以减少接触状态下信号的干扰.实验结果表明,利用PILCO算法在迭代8次后能够得到较稳定的力,相比于模糊迭代算法收敛速
其他文献
<正>华黎无疑是中国当代优秀青年建筑师中的重要一员,近年来有不少收获。先后在清华和耶鲁受到建筑学的基本教育,华黎于2009年在北京创立了TAO迹·建筑事务所(tracearchitect
<正>在经济领域里,企业家与企业相互依存、相互促进,企业家推动企业发展,企业成就企业家。教育领域同样如此,没有好校长,就办不出好学校;培养众多优秀校长,才能办出众多优秀
目的分析45例胃肠道间质瘤的CT表现特点,探讨螺旋CT对胃肠道间质瘤的良恶性诊断。方法回顾分析45例原发性胃肠道间质瘤的临床及影像学资料。结果45例GIST中,恶性26例,良性19
在英语教学中采用现代教育技术对培养学生的创新意识、创新能力具有重要的意义。应用现代教育技术,采用先进的现代教育理念、教育手段及教育方法是推进英语教学改革的有效途
目的探讨磁共振扩散加权成像(DWI)在超急性脑梗死诊断中的应用价值。方法回顾性分析经临床诊断24例超急性期脑梗死病例的常规MRI及DWI检查影像图片。结果 16例患者常规MRI扫
<正>在日常生活和教学中,我们发现儿童有一个共同的爱好——绘本。绘本以精致优美的绘画、简练生动的语言,展示故事情节,简单易懂,又极具视觉美感,是一种少儿喜爱的读本。正
目的探讨纳洛酮联合醒脑静注射液治疗急性重度酒精中毒的临床效果。方法87例急性重度酒精中毒患者被随机分为实验组(n=45)和对照组(n=42),2组均给予基础治疗,对照组给予纳洛
立德树人教育根本任务在政治发动以后,中国教育界开始了实践探索,同时学术界围绕师德培养、师资队伍建设、实施路径构建、历史资源挖掘、价值功用等几个方面展开了研究。目前
松阳县地处浙西南,属瓯江上游的松阴溪和小港溪蜿蜒而下,由北至南流灌被称为浙南粮仓的松古盆地。因山环水绕,群山隔绝,自宋金战乱以后,偏居一隅的松阴溪两岸,曾被称为中原文
利用折合质量和相对运动知识以及能量守恒定律和动能定理等规律巧妙解答有关两个相互作用物体的相对直线运动问题。