基于网络变换的高效神经架构搜索

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zty85633278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计有效的神经网络架构对于深度学习的性能是至关重要的。虽然目前自动设计深度神经网络结构的技术(例如基于强化学习的方法)显示出非常好的结果。然而,这些方法的计算量需求过高,使得它们难以被广泛使用。一个明显的限制是,他们仍然在从头开始探索结构空间和训练每个网络,这是非常低效的。在本文中,我们提出了一种新的高效神经网络结构搜索框架。这个方法会基于当前给定的网络去探索结构空间并会重用其权重。我们使用了一个强化学习智能体作为元控制器。它的动作是通过保持功能的网络变换来增加神经网络的深度或宽度。这样,先前验证的神经网络可以重复用于进一步探索,因此可以节省了大量的计算成本。此外,为了进一步提高性能,我们提出路径级网络变换操作来解决当前网络变换操作的局限性。这些网络变换操作只能执行层级的结构修改,例如添加(修剪)过滤器或插入(移除)层,无法更改神经网络的拓扑结构。基于提出的路径级网络变换操作,我们进一步提出了一个双向树结构的强化学习元控制器来探索树形的神经网络结构空间。这个树形的神经网络结构空间可以看成是当前多分支神经网络结构空间的泛化版本,并可以在每个卷积神经网络(CNN)单元内嵌入丰富的路径。在受限的计算资源下,我们应用提出的方法来自动设计神经网络结构,应用于图像分类任务。与人工设计的和其他自动设计的神经网络结构相比,我们的方法可以设计出非常具有竞争力的神经网络结构。在一个小规模的图片分类基准数据集(CIFAR-10)上,我们链状卷积神经网络(CNN)模型达到了4.23%的测试错误率,超过了绝大多数最新的神经网络结构。此外,通过将我们的方法与最佳的人类专家设计的神经网络结构相结合,我们能以14.3M参数量在这个小规模的图片分类基准数据集(CIFAR-10)上实现2.30%的测试错误率。而在移动设置的大规模图片分类基准数据集(ImageNet)上,我们的方法能达到74.6%的前1精度。这验证了我们自动设计的神经网络结构的有效性和可转移性。
其他文献
水库水资源作为全球水资源的重要组成部分,深刻地影响着周边人类的生产生活。水库在河川径流调节、蓄洪补枯、灌溉、发电等水资源利用与开发方面起到了重要作用。干旱区流域
白背飞虱[Sogatella furcifera(Horváth)]和褐飞虱[Nilaparvata lugens(Stal)]是重要的稻作害虫,具有迁飞性,同时发生范围广、危害严重、可传播病毒,严重威胁我国的粮食生产
目的:归纳针刺治疗腰痛RCT中假针刺对照组的实验设计,并探讨其设计特点,为高质量的RCT假针刺设置提供合理参考意见。方法:文献检索采用数据库联合检索的方式,检索来源包括:中
随着中国经济发展进入新阶段,经济政策不确定性风险加剧。中国金融体系的发展还不成熟,金融市场创造资产的能力与发达经济体间存在差距,加之中国对国际收支资本账户管制严格,
进入21世纪以来,互联网渗透进了人们生活的方方面面,如信息获取、电子商务、交流互动、娱乐应用等等。互联网带宽的显著增长推动了全世界电信业的发展,因此,作为现代信息基础
经皮冠状动脉介入作为治疗动脉粥样硬化等心血管疾病最有效的方式,近年来在临床上得到广泛应用,但晚期支架内再狭窄问题并没有得到彻底解决。研究表明,支架植入后血管力学微
含氮杂环作为一类极其重要的结构普遍存在于各类重要的天然产物中,与此同时也广泛应用到药物化学以及生物化学中。因此,关于此结构的快速高效合成一直是有机化学家和药物化学
本文研究了quintessence影响下的RN(A)dS[Q-RN(A)dS]时空的视界及粒子的测地线、RN AdS黑洞的一阶相变和Grumiller时空中的黑洞热力学及相变。本文引进了一个研究时空分类的新方
随着我国城市化进程的加快,部分高烈度地区城市高层建筑建设量大增。对于部分抗震设防烈度达9度的地区,在高层建筑的结构设计中,传统钢筋混凝土剪力墙结构体系逐渐出现较难满
近年来,量子点作为一种新型的准零维半导体材料备受瞩目。由于量子点具有独特的物理特性和光学特性,其应用领域日趋广泛。硒化铅(PbSe)量子点的发光特性,非线性效应以及热光