基于种群演化的超参数搜索及其在机械手抓取模仿学习上的应用

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:yyk20071999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件计算能力特别是大规模分布式并行计算的飞速发展,机器学习领域得到了长足的发展。在训练数据足够充分的前提下,机器学习算法的超参数配置问题是其取得较好效果的关键。超参数是在某个机器学习算法运行之前,首先需要选取的参数,例如深度学习算法中的,控制神经网络学习速度的学习率。超参数搜索的目的是为某个应用的算法选择一组好的超参数,使此算法性能达到最佳。在以往机器学习超参数选择问题中,领域内研究者一般都是基于个人经验对超参数进行人工选择。随着数据规模指数级上升,虽然大规模计算加速设备的飞速进展使得深度学习特别是深度强化学习算法在处理海量的图片等数据方面显示出强大的优势,但是在超参数选择问题上仍然是一个未解决的难题。近年来随着深度学习模型的不断增大,其训练成本即超参数的搜索空间也在不断变大,然而传统超参数搜索算法大部分是基于顺序执行训练,往往需要等待数周甚至数月才有可能找到较优的超参数配置。为解决深度学习超参数搜索时间长和难以找到较优超参数配置问题,本文提出一种新的超参数搜索算法——基于种群演化的超参数异步并行搜索(PEHS)。算法结合演化算法思想,利用固定资源预算异步并行搜索种群模型及其超参数,从而提高算法性能。本文设计实现了在Ray并行分布式框架上运行的参数搜索算法,通过实验表明在并行框架上基于种群演化的超参数异步并行搜索的效果优于传统超参数搜索算法,且性能稳定。机械臂是机器人领域应用最广泛的机械装置,其行为获取的研究是机器人运动技能研究的一个重要方面。示教学习是一种快速高效的学习方式,通过对示教行为的学习,使机械臂快速获取运动技能,从而简化复杂的运动规划,提高学习效率。围绕机械臂通过示教学习获取运动行为展开研究,本文设计一个卷积神经网络模型(CNN),通过监督学习的方式结合基于种群演化的超参数异步并行搜索算法(PEHS)进行基于模仿学习的库卡机械臂抓取研究。该方法可以利用有限的硬件资源,快速评估网络体系结构,同时确保并行训练的各个网络在优化过程中选择适应当前模型的良好的超参数,使模型的准确性和鲁棒性更强。通过实验表明结合PEHS算法后比监督学习(数据聚合)方法的实验精度有效提高6%左右,且算法的稳定性较强。
其他文献
随着可穿戴设备的迅速发展,其中的关键性元件—柔性传感器的开发和使用也得到越来越多的研究和重视。柔性传感器开发的关键是要满足人体服用和运动的需要。由纺织工艺制备的
在吉林抚松地区出露一套太古宙角闪岩相变质岩石,其形成时代和成因机制长期悬而未决。选定其中的斜长角闪岩作为研究对象,进行了岩石学、矿物学、岩石地球化学、锆石U-Pb年代
无线电导航技术的发展极大提升了船舶航行的安全性,而美国GPS在船舶上的广泛应用对船舶交通更是具有革命性的意义。我国自1994年开始自主建设北斗卫星导航系统,经过多年的发
极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)通过向地面主动发射微波成像,能够获取丰富的地物极化信息,受昼夜、气候等因素的影响较小,因此已在地物分
气体检测的关键部件是气体传感器,现有气体传感器存在体积大、系统复杂、价格昂贵等问题,难以满足目前气体检测的需求。TiO2纳米管传感器以其低功耗、易集成等优点,成为气体
伴随着风电技术日趋成熟,风电产业也得到了飞速发展,在世界范围内风力发电累计装机容量快速增长,风电场对其附近的气象雷达台站的影响案例也在逐年增加。由于风轮机的电磁散
合成孔径雷达(Synthetic Aperture Radar,SAR)在全天时、全天候、工作距离远、高分辨和穿透能力强等有显著优势,近几年来在军事预警、态势评估、灾害预警、资源管理勘探、环
在环境污染和能源短缺的压力下,世界各国开始重视清洁新能源的发展。化学链气化技术(Chemical-Looping Gasification,CLG)是一种基于化学链燃烧技术(Chemical-looping combustio
近年来,学者们在陶瓷颗粒增强金属基表层复合材料的热疲劳特性方面开展了多项研究,但由于增强颗粒与基体、复合层与基材间热物理性能存在差异导致其在激冷激热的工况下作业时
空气质量指数(AQI)是衡量区域环境空气的综合性指标,可通过计算二氧化硫、二氧化氮、一氧化碳、臭氧、可吸入颗粒物和细颗粒物六种污染因子的空气质量分指数而获得。本文选用