基于视觉示教的机器人任务学习方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:yunzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来机器人应用领域的飞速拓展,通过观察人类示教过程自动掌握新任务的方法成为机器人领域的又一个研究热点。总体而言,该领域主要涉及示教信息获取和机器人任务学习两个方面的内容。伴随机器人技术的不断革新,示教信息的获取方法从传统的基于离线编程和示教盒的方式转变为后来的拖动示教方式,进而又发展为现阶段的基于视觉观察的示教方式。示教任务中操作物体的检测与位姿估计是视觉观察的核心内容。不同于一般视觉感知任务,示教过程涉及的目标物体特征多样且更换频繁。针对这些特点,基于多模态局部特征RGB-D patch的算法具有更好的应用前景。然而现有RGB-D patch特征不具备旋转不变性,并且对于前景遮挡与背景干扰问题较为敏感。由于这些问题在示教场景内不容忽视,本文提出一种具旋转不变性且对环境干扰具有鲁棒性的局部特征E-patch。E-patch以前景深度边缘点为中心沿深度梯度方向采样,从而具有良好的旋转不变性。依据深度检测结果剔除E-patch中的前景遮挡和背景干扰区域,从而提升了对环境干扰的鲁棒性。在孪生网络框架下训练基于CNN建立的特征编码器,以实现E-patch相似性度量向特征向量欧氏距离空间的映射。结合特征匹配和位姿投票算法的优点,本文提出一种基于E-patch特征的目标检测与位姿估计算法。在离线阶段中,借助Ch Ar Uco标定板重构目标物体的网格模型之后,从均匀分布的采样视角得到RGB-D渲染视图,最后利用提取自各渲染视图的E-patch构建特征码书。在线阶段则通过特征匹配和位姿投票算法框架生成假设位姿。针对物体模型中不可见点对ICP配准结果的干扰,仅基于可视曲面实现假设位姿的检验与细化。在机器人任务学习方面,模仿学习方法以复现人类示教任务为目标,但通常脱离机器人系统的实际情况;强化学习方法面向实际系统但因巨大的动作探索空间而面临维数灾难的问题。本文结合二者优势提出一种兼顾便捷性与可靠性的机器人任务学习方法。首先,示教人员仅需完成单次的面向视觉观测的示教工作,之后基于DMPs框架通过对示教信息的模仿学习与泛化实现机器人动作探索空间的缩减,最后采用DDPG强化学习算法完成机器人动作策略的优化。为提升训练过程中动作策略的成功率,基于点吸引子系统设计运动控制器。为验证本文任务学习方法的效果,基于UR机器人、Kinect深度传感器和上位机搭建学习拾放任务的实验平台。实验过程中首先基于模仿学习与强化学习算法训练得到机器人的运动控制器,之后基于视觉感知算法估计初始场景内操作目标的空间位姿,最后将其代入运动控制器驱动UR机器人完成拾放任务。各项实验结果均体现了本文所提出的基于视觉示教的机器人任务学习方法的可行性与有效性。
其他文献
心脏疾病危害人类健康,是造成人类死亡的主要原因之一,长期以来,心脏疾病研究一直是医学界的重要课题。因为非侵入、经济、便捷灵活的特点,心电图成为了临床上重要的常规检查手段。但是,考虑到心电图的个体性差异和心脏疾病信息分析的复杂性,现有的心律失常自动分类算法在分类准确率等方面的表现并不理想,无法满足大量心电数据辅助诊断的需求。此外,大量重复的心电图识别工作还容易使医生产生疲劳,引发误诊。近年来,随着大
按照《巴黎协定》规定,联合国环境规划署要求全球碳排放量在2020年至2030年必须以每年7.6%的水平下降,否则气候引发的自然灾害发生率和破坏率会大幅增长。减少船舶能源消耗,提高能源使用率,降低碳排放量是目前船舶行业发展的一个重要发展方向和研究目标。随着复合材料螺旋桨的应用越来越广,复合材料螺旋桨的节能减排成为当前研究的重点和难点。桨-舵匹配是一种易实现的节能措施。复合材料的可设计性和桨-舵匹配为
历次震后调查均发现,严格按照现行抗震规范设计的钢筋混凝土(Reinforced Concrete,RC)框架结构,能够实现“大震不倒”的抗震设计目标,但却常常遭受难以修复的严重破坏,在震区造成大量“站立的废墟”,带来难以估量的经济损失。预制预应力自复位(Precast/Prestressed Self-Centering,PPSC)钢筋混凝土框架结构由于主体构件地震损伤轻、震后可较快恢复使用功能的
在巨大的燃油消耗和严峻的环境问题的双重压力下,开发更有效的汽车气动减阻技术显得尤为迫切。被广泛研究的简化Ahmed汽车模型为研究具有高度三维性和复杂性的真实汽车绕流提供了很好的参考。根据车模尾窗倾角()的范围12.5°-30°和大于30°,Ahmed车模尾流可以被分别分为高阻和低阻流态。一方面,先前对于低阻流态的理解十分有限,尤其是对非定常结构及其频率。另一方面,本团队前期研究发现,将位于高阻车模
铌酸锂(Lithium niobate,LiNbO33)是一种集压电、铁电、电光、非线性光学、光折变、声光性能等效应于一体的多功能材料。由于其出色的电光系数和非线性光学系数,LiNbO33被认为是未来光子芯片设计和制备的主要材料。然而,LiNbO33稳定的晶体结构、高熔点、热膨胀系数大、脆性高等物理性质,严重地限制了与其他材料,例如:硅(Silicon,Si)、二氧化硅(Siliocn dioxi
尾缘噪声是翼型自噪声的主要来源,中低雷诺数层流下刚性翼型尾缘易产生高幅值单音噪声,破坏空中、水下航行器的安静性。翼型可变形设计为降低航行器噪声和提高航行器经济性提供了新的途径,具有广阔的应用前景。弹性尾缘是可变形翼型的一种基本形式,结构相对简单。然而,目前对翼型弹性尾缘噪声的产生机制和声学特性的研究十分有限,对不同弹性尾缘形式、结构参数下辐射噪声的变化规律研究亦较少。针对以上问题,本文以NACA0
近年来随着超精密加工制造及精密计量等领域的快速发展,位移测量精度需求逐渐由纳米量级向亚纳米甚至皮米量级过渡。非共光路外差干涉光路由于解决了传统共光路外差干涉光路中几纳米至十几纳米的周期非线性误差,已然成为下一代干涉仪的发展方向。然而,非共光路干涉结构的光路更复杂且光程更长,这导致其比传统共光路干涉结构更容易受到温度的影响,此时镜组热漂移误差则凸显出来,成为制约非共光路外差干涉仪进一步提高测量精度的
城市化进程的快速发展带来了人口数量增加与土地资源短缺矛盾,也促使建筑寻求向高空发展,超高层建筑高度不断刷新,可预期的千米级摩天大楼在策划和憧憬。目前,千米级摩天大楼的许多研究领域仍处于探索阶段,有必要开展深入研究,为千米级摩天大楼的建造提供技术支撑。本论文重点关注千米级摩天大楼暖通空调系统设计建造中的室外设计参数选取、能源系统设计策略、系统分区模块式设计方法、烟囱效应的应对策略等方面问题,以期为千
湍流边界层广泛存在于日常生活和工业生产中,如商用客机、高铁和管道运输等。在这些应用中,湍流边界层中的壁面摩擦阻力是造成能量消耗的主要原因之一。例如,商用客机在正常巡航时,湍流边界层中的壁面摩擦阻力占其总阻力的一半以上。降低湍流边界层中的壁面摩擦阻力不仅能够带来巨大的经济效益,还能有效地减少化石燃料燃烧导致的温室气体排放,从而有利于保护环境。因此,研究湍流边界层减阻技术在工程中具有重要意义。在湍流边
语音情感识别在人机交互领域具有广泛的应用场景,例如呼叫中心、移动服务等。在实际应用中,语音情感的复杂性,不仅使得需要采用高维的特征来对每个状态进行刻画,而且也令数据标注的代价高昂且费时。因此,学习具有判别性的低维语音情感特征表示,就成为语音情感识别研究的关注焦点之一。半监督语音情感特征学习作为一种主流的方法,其大体可分为两类:一是对单一来源的数据,通过利用分布一致的大量无标注数据与少量标注数据进行