基于机器学习的机器人智能控制方法研究与实现

来源 :江汉大学 | 被引量 : 0次 | 上传用户:luo_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着机器人在工业生产和日常生活中的应用越来越广泛,其机器人的智能控制方法也更值得关注,特别是多自由度人形机器人的步行智能控制是机器人研究领域的重点研究方向之一,机器人运动过程中的惯性和环境等因素会对机器人的平衡产生相当大的影响,如采用传统的运动物理模型可以解决一部分控制问题,但很难适应环境复杂度和交互需求不断提高的要求。而用机器学习的方式能让机器人自主与环境交互,不断提高平衡控制能力是机器人平衡算法的发展趋势。强化学习是机器学习中的一个分支,作为基于奖惩机制的非监督算法,不依赖任何先验知识即可通过与环境交互选择最优动作,对于双足机器人的智能控制中具有较强的理论和实用价值。论文首先分析了双足机器人行走时的运动物理结构模型,研究了强化学习各种算法,分析了各自的特点。建立了机器人步态环境空间、状态空间、动作空间,抽象机器人智能体模型,建立基于tensorflow和gym强化学习虚拟仿真环境,较大程度考虑真实环境信息,提高算法训练效率,保证训练得到基本控制模型的适用性。根据双足机器人的腿部输出连续的动作空间特征,采用DDPG强化学习算法解决连续动作空间问题,提出了基于目标区域与指向性的引导奖惩机制的DDPG改进方法,提高机器学习的收敛效率,缩短了机器学习的训练和收敛时间,实验结果显示改进方法的有效性和实用性。在真实环境下,提出了强化学习服务器与NAO客户端远程运行模式,采用Choregraphe和python混合编程方式,搭建Nao机器人强化学习平台,实现模型数据的实时传输,结合DDPG算法模型参数的nao机器人可实现正常移动。构建了真实机器人智能控制方法的自学习环境,为进一步实现机器人智能控制提供了物质基础。
其他文献
山体雕塑作为推进中华优秀传统文化传承发展的楷模,其发展历程几乎同步于人类文明的进步,展现了中华儿女绵绵不断的人文情怀。从一个个伟岸的雕塑形象中,人们不但了解了国家
在超导瞬变电磁法的测量中,实测数据中常会出现极化效应,无法利用电磁-极化数据直接计算视电阻率值,这会使电阻率反演结果无法准确分辨矿体位置。因此,为反演结果更加准确,得到更丰富的地下异常体信息,极化效应必须被重视,极化效应的特征主要与零频电阻率、充电率、时间常数和频率相关系数等四个极化参数有关,所以极化参数的提取具有重要意义。本文在吉林省科技支撑计划重点科技攻关项目—基于SQUID的磁极化-感应双场
近几年篮球运动向着小、快、灵的方向,攻防转换节奏加快,想要适应现在的比赛节奏,需要优秀的身体素质作为前提,尤其是出色的弹跳力,是影响比赛成绩和比赛观赏程度的关键因素,
电化学传感器具有体积小、成本低、响应速度快、灵敏度高、抗干扰能力强等优势,在分析化学中占有重要地位。纳米材料因其比表面积大、催化活性高而被广泛应用于电极修饰材料,
电视纪录片自产生起就因具有广泛的传播范围,长久的留存方法和贴近式的观察等特点,被人们接受和喜爱。影像纪录既加速了文化的传播,又满足了人们探究他者文化和洞察社会百态
反向抵押权是老年人通过自有产权房屋进行担保以获取养老资金的一种权利,我国《民法典》物权编对此未作规定,但国外已有将反向抵押权规定在民法典中的先例。构建反向抵押权,
随着系统级封装技术及制作工艺的不断发展,封装结构的集成密度急剧增加,对集成电路热问题进行数值分析计算量也越来越大。相应地,串行计算变得也越来越困难。与此同时,多核计
伴随着互联网技术的蓬勃发展,各种社交软件走入了我们的生活,每天我们都需要接触各种形式的多媒体信息。如何快速、准确地捕捉到其中的信息,对其进行有效的利用成为一个重要的研究课题,引起学术界的广泛关注。在这种趋势下,图像检索技术得到了充分又全面的发展。早期的图像检索是基于图像文本标签的。这种方法存在两个主要问题:第一,使用的图像需要经过人工的文本信息标注,这显著增加了物质成本和时间成本;第二,在背景更复
中国山水画从古到今流传几千年,以其鲜明的笔墨语言、丰富的表现技法,彰显了中华民族的艺术精神和人文气象,成为我们描绘自然、阐释世界和表情达意的重要载体之一。该论文主
艺术创作是艺术家根据生活经验与艺术修养的积累,运用一定的形式语言对客观物象进行的审美创造活动。本文主要从选题来源、形式语言的运用以及情感表达三方面对毕业创作《石