基于强化学习的机器学习流水线超参数优化研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:Andy_nnu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习技术通过与各个产业进行深度融合,改变着我们的生活方式,广告推荐、智能扫地机器人、自动驾驶等各种人工智能和机器学习的应用正在蓬勃发展。机器学习流水线(Machine Learning Pipeline,MLP)在其中扮演了重要角色,它支撑着模型的快速开发、测试和迭代。机器学习流水线能够将机器学习过程中的数据预处理、特征选择、模型训练等步骤进行流式化封装和管理,提高了机器学习的研发效率。在使用机器学习流水线进行实验的过程中,存在一个非常关键的问题:超参数的选择。然而,超参数调优这一过程极度依赖经验,传统方式主要通过人工调优,这不仅耗时耗力,而且往往收益不高。超参数优化(Hyper-parameter Optimization,HPO)作为自动机器学习的一个重要研究领域,能够通过自动化的方式,搜索出机器学习算法的最佳超参数,减少人工干预。然而,目前机器学习流水线超参数优化的相关研究尚存在着诸多问题:(1)超参数的类型通常包含离散型和连续型,面对这种混合类型的配置空间,大部分算法选择将连续值离散化,然而离散间距过大,会导致算法无法搜索到最优的超参数配置,离散间距过小,会导致搜索数量呈指数递增。(2)机器学习流水线中包含多个算法,这导致超参数的配置空间维度成倍增加,高维的搜索空间导致优化算法难以搜索到最优的超参数配置。(3)大部分超参数优化算法的搜索空间在训练过程中保持不变,然而超参数优化的过程是非常耗时的,如果在算法表现较差的配置空间进行过多的探索,会产生额外的搜索开销,甚至可能导致算法收敛至次优解,给算法带来不稳定性。针对上述问题,本文使用多智能体强化学习方法进行机器学习流水线上的超参数优化,并在迭代过程中对智能体的动作空间进行动态修剪,以提高搜索效率,主要工作如下:1.提出了基于多智能体近端策略优化的超参数搜索算法。针对机器学习流水线中存在的混合动作类型问题,本文提出了一种复合动作空间的设计来处理离散、连续超参数的选取。对于多个算法同时存在造成的超参数配置维度过大问题,本文通过将流水线的超参数优化建模为多智能体协作问题,来降低每个智能体的动作维度。2.提出了基于多智能体动态动作空间的超参数搜索算法。智能体在较差的配置空间进行探索,不但会消耗额外的计算资源,并可能会导致算法收敛于次优解。本文根据迭代过程中收集的历史数据,筛选出关键超参数及对应的高性能区间,在智能体的迭代搜索过程中对动作空间进行动态修剪,使智能体向核心搜索空间聚拢,避免其在低性能的空间过多的探索。将智能体往高性能区间引导还能够增加智能体搜索到更优配置的概率,并使算法能够更快收敛,有效降低算法方差。3.设计开发了基于超参数自动优化的机器学习流水线平台。本文使用上文提出的基于强化学习的超参数搜索算法,设计了一个能够对机器学习流水线自动进行超参数优化的机器学习平台。该平台允许科研人员通过拖拽算法组件的交互方式,构建机器学习流水线并进行实验,每个机器学习算法的超参数可以通过可视化的方式进行设置。该平台能够避免低效的手动调参工作,提高科研效率。
其他文献
复合衬垫具有优越的防水性能,现在常用在有防渗要求的工程中。复合膨润土防水毯(复合GCL)的出现,进一步提高了复合衬垫的性能。在生产、运输和施工过程中,会不可避免的使衬垫产生损伤和缺陷,影响到衬垫的防渗性能。本文分别通过试验和模拟的方法对不同工况缺陷下,复合衬垫层内部各个空间及材料的水力学性能进行研究。研究内容如下:(1)首先开展界面导水系数测试试验,对国外下孔进水试验仪器进行了改进,用以测试国内外
学位
洪水及洪水所携带的漂浮物是威胁村镇建筑结构安全的重要灾种之一,洪水及洪水漂浮物会对村镇建筑结构产生较大的侧向力甚至导致房屋结构破坏倒塌,严重危害了人民群众的生命财产安全。目前针对洪水漂浮物对村镇结构冲击作用的研究开展较少,给村镇建筑结构在洪水中的安全性留下了巨大隐患。针对这一问题,本文以村镇建筑中的典型的框架填充墙结构为研究对象,基于有限元软件LS-DYNA,考虑洪水浸泡对结构力学性能的影响,建立
学位
钢材由于价格低廉、力学性能优越,在海洋结构工程中得到广泛应用。然而在海洋环境中,钢结构除承担上部结构传来的荷载及自重以外,还会受到风、波浪、洋流等复杂环境荷载的耦合作用。海洋工程中一些高耸结构,例如海上风力发电机、海上桥塔、测风塔等,结构不同部位处于不同的海洋环境,腐蚀机理和腐蚀程度也不同。其中浪花飞溅区内会频繁的出现干湿状态交替,氧气供应充足,加速阴极反应,钢材的腐蚀尤为严重。海洋工程结构在浪花
学位
装配式钢结构体系具有轻质高强、抗震性能好、工业化程度高、施工快捷、环境污染小、便于改建拆卸且可回收利用等优点,符合国家“四节一环保”的政策导向和“建筑工业化”的战略需求。而装配式节点技术的先进与否则是衡量装配式钢结构可靠性和合理性的关键要素。为了更好的提高钢框架结构的装配集成度,推动装配式钢结构的健康发展,本文以一种新型柱-梁-柱一体式钢框架可变梁高节点连接为对象,对其力学性能及设计方法展开深入研
学位
学位
建筑结构的抗震韧性及震后恢复能力是当前地震工程领域的一大热点,本文首先针对安装有自复位防屈曲支撑的钢框架从损失函数和修复时间进行定量分析,并采用基于直线型恢复函数的修复路径进行韧性研究,最后通过改变支撑结构参数,根据参数分析结果给出了基于概率的七参数直线型函数经验公式,主要完成的工作如下:第一,利用Open Sees建立自复位防屈曲支撑钢框架(SCBRBF)结构的有限元分析模型,并通过模态分析和非
学位
湿度大、盐分高的海洋大气环境,会引起近海建筑物结构及其内部设备腐蚀,提高维护成本,造成巨大的经济损失。主要原因是溶解在金属表面液膜中的氯离子,穿透金属保护膜,腐蚀内部金属,导致结构失效或破坏。若大气中含有SO2、硫化物等污染性气体,提高了环境酸性,相互之间形成协同效应,会提升金属的腐蚀速率。目前可通过采用耐腐蚀材料、喷涂三防保护涂料或使用封装技术将局部空间内的设备或部位和工作环境隔离开等措施实施保
学位
结构在震后往往会有较大的残余变形,减小残余变形对保护结构具有重要意义。本文主要对节点耗能的自复位支撑钢框架和内芯耗能的自复位支撑钢框架进行拟静力分析,结果表明:自复位支撑在强震下能够大幅减小结构的残余变形,起到保护结构的作用。此外本文提出了一种改进的自复位耗能支撑并用于梁柱铰接钢框架中,应用后发现这种经改进后的自复位耗能支撑耗能和复位效果均比较理想,并且完成了耗能任务从钢框架到支撑的转移。主要研究
学位
医学影像分割与重建是医疗辅助诊断中的关键任务,其目的在于从像素级别准确识别出目标器官、组织并还原其三维结构。而在复杂的组织结构中不断提高精度已成为精准医学和智慧医疗的迫切需要,其研究具有一定的实际意义。本文主要研究了基于CT医学影像的多器官分割与重建的关键技术,着重探索了基于Transformer的轻量级分割算法、基于NAS的高效分割架构搜索策略以及基于主动轮廓模型和图卷积的三维重建算法。首先,在
学位
自我国推行市场经济体制以来,在利益的驱动下许多商家的虚假宣传行为愈演愈烈。尽管我国已经出台了《反不正当竞争法》《广告法》《电子商务法》等法律法规对虚假宣传行为予以规制,但虚假宣传的现象仍然较为普遍。惩罚性赔偿作为一种严厉的损害赔偿责任有助于遏制、威慑虚假宣传之风,有关虚假宣传的惩罚性赔偿问题值得进行专门研究。虚假宣传是虚假的或者引人误解的商业宣传行为,在具体案件中其成立不以消费者是否陷入错误认识为
学位