高效深度神经网络设计及训练方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:aini123321231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度神经网络已经在多个人工智能应用领域中表现出强大的性能,包括图片识别、目标检测、语义分割、语音识别和自然语言处理等。其中,深度神经网络的模型设计和训练是获得高性能模型的关键因素,得到了学术界和工业界的广泛关注。然而现有的深度学习技术仍然存在以下几个亟待解决的难点问题:首先,现有的深度神经网络往往包含非常多的计算操作和复杂的连接,其中存在大量的计算冗余,不仅增加了模型的计算开销还会限制模型的性能;其次,神经网络结构复杂,其设计或搜索空间往往非常大,难以充分探索整个空间设计出高性能的网络结构;再次,深度神经网络的计算代价高昂,当计算资源有限时难以满足实际应用场景的要求;最后,深度模型的训练非常依赖训练数据,当数据分布变化时会严重影响训练的稳定性。针对上述挑战,本文采取的研究方案如下:1)针对神经网络结构中包含大量计算冗余的问题,提出了神经网络结构自动优化算法,以定位任意给定的网络结构的冗余部分并进行优化。具体而言,提出了一个网络结构变形器,将任意网络结构作为输入并逐一检测其中的计算操作是否是冗余的,并用计算开销更低的计算操作替换这些冗余操作,以达到网络结构优化的目的。为了更精准地优化网络结构中的冗余计算操作,进一步提出了基于图卷积网络的决策模型,用图表示网络结构并提取其中复杂的连接关系。所提出的方法能够在人工设计的和自动搜索到的网络结构上大幅度提升模型性能。2)针对网络结构搜索空间大难以探索的问题,提出了面向超大搜索空间的网络结构搜索算法,利用课程学习中渐进式的学习方式逐步探索搜索空间。为此,首先分析了影响搜索空间大小的关键因素,发现增加网络结构中的计算操作种类数量比增加节点数量能够更平缓地增大搜索空间,为渐进式网络结构搜索提供可能。在此基础上,提出了基于课程学习的搜索策略,通过逐步引入新的计算操作构建一系列由小到大的搜索空间,并以渐进式的方式逐步探索搜索空间。所提出的方法在多个图片分类数据集上能够找到高性能的网络结构。3)针对深度模型的计算代价难以满足实际需求的问题,提出了面向不同计算资源预算的网络结构生成器,实现为任意计算资源预算自动生成满足约束的网络结构。为此,学习一个由模型性能和计算开销构成的Pareto边界,该边界由不同计算开销对应的最优网络结构构成,在预测时只需要根据所需的计算资源预算在Pareto边界上搜索即可。为了学习这个Pareto边界,进一步提出了针对不同计算资源预算的网络结构评估器,准确评估网络结构生成器所生成的网络结构。在多个不同硬件设备上,所提出的方法都能生成满足计算资源约束的网络结构。4)针对深度模型由于对数据敏感导致的训练不稳定问题,提出稳定的归一化方法及一套相应的训练算法,以降低训练过程对数据分布变化的敏感性。为此,提出了基于记忆的批量归一化方法,将过去最近的多个数据批次作为记忆,在其上计算用于归一化的统计量,以减小单个批次数据对训练的影响。基于所提出的批量归一化方法,进一步提出了一个双前向传播训练算法,在每一次迭代中执行一次额外的前向传播使得每个归一化层的统计量保持最新状态,以此缓解由于模型更新造成的分布偏移问题。使用基于记忆的归一化层构建神经网络,并使用所提出的训练算法训练深度网络可以大幅提升模型的泛化能力。上述研究内容有助于降低神经网络的设计难度,提升神经网络的训练稳定性,以推进在实际应用中面向硬件设备的模型部署。研究成果有望丰富深度学习和自动化机器学习等研究领域的相关理论和关键技术。
其他文献
深熔K-TIG焊(Keyhole Tungsten Inert Gas,K-TIG)作为一种高能量输入的焊接方式,在中厚度的金属板材的对接焊接工艺中起重要作用。深熔K-TIG焊接无需加工坡口,对板材一次焊透,正面与背部同时成型,能加快中厚板焊接的生产速度,在船舶与大型容器制造行业中应用广泛。为了提高焊接生产率,深熔K-TIG焊接过程的自动化成为目前实际生产中的发展方向,而熔池状态的检测则是实现自动
弹性体材料在国民经济和国防建设中不可或缺。为了获得实用的力学性能和弹性,弹性体需要进行化学交联,并常通过纳米填充实现其增强。然而,纳米填充存在填料聚集、界面调控困难和加工粘度大等问题。另一方面,共价交联的弹性体难以实现再加工和再利用,使得废旧橡胶制品成为固体废弃物管理和循环经济面临的主要挑战之一。因此,探索弹性体增强和实现其重复加工利用的新方法具有重要意义。近年来,通过引入动态牺牲键增强弹性体或者
职业教育作为基本公共服务内容,是促进实现共同富裕的动力引擎。发展职业教育和促进共同富裕在历史逻辑上具有共生共长性,在理论逻辑上具有本质一致性,在价值逻辑上具有互补共享性。在功能结构理论视域下,职业教育功能是育人功能、社会功能、保障功能、传承功能、生成功能、适应功能的聚合体。基于此聚合体,职业教育促进共同富裕的实践路径是:确立“育人—传承”功能主导地位,增强促进共同富裕的“人力值”;建构“适应-生成
制冷空调系统在国民经济总能耗中占比高达15%,随着“碳达峰”和“碳中和”的逐步推进,蒸气压缩式制冷循环运行能效的提升变得至关重要,蒸气压缩制冷系统启动过程能效下降,制冷量衰减,因此,研究制冷系统启动过程制冷量衰减的机理,探索启动性能提升的方法有助于提高制冷系统全年能效比,有助于减少食品冷链中的食品损耗、提高空调系统热舒适性,有助于减弱制冷剂种类对系统启动性能的影响,有助于部分加快制冷空调行业制冷剂
随着社会发展和人口老龄化的加剧,骨骼创伤患者也在逐年增加。钛基植入体具有良好的理化性能,是目前骨科临床应用最广泛的植入材料之一,全球骨科植入材料对钛基植入体的依赖性逐渐加深。在此背景下,钛基植入体在应用过程中所存在的一些问题也日益凸显,特别是因其生物惰性表面而容易引发的细菌感染和植入体松动问题,已成为导致钛基植入体植入失效的两个重要原因。理想的钛基植入体表面应同时具有优异的抗菌活性和促骨整合性能。
以聚环氧乙烷(PEO)和聚环氧丙烷(PPO)为代表的脂肪族聚醚是产量最大的合成高分子类型之一,在基础研究、国计民生和高新技术的诸多领域具有几乎不可替代的价值。不断扩展和精细化的应用对聚醚合成方法的效率、选择性和环境友好性,以及聚醚的功能化策略,即如何定量定点地引入可赋予聚醚特定性能的基团,提出越来越高的要求。作为脂肪族聚醚实验室合成及工业生产的主要途径,环氧化物开环聚合的发展是应对上述挑战的必经之
近年来,肥胖症患者人数逐年增加,预防和治疗肥胖成为迫切需要解决的社会问题。目前市面常见的减肥产品效果不佳,且部分药品副作用较多,因此探寻一种食源类抗肥胖产品具有重要意义。沙棘籽粕为加工副产物,营养价值丰富且蛋白含量较高(约20-30%),可作为天然植物蛋白肽的来源。本文以沙棘籽粕为原料,采用不同方法制备沙棘籽粕蛋白,并对其酶解工艺进行优化,通过超滤、大孔树脂分离、固相萃取、超高压液相色谱-质谱联用
有机太阳电池(OSC)和有机光电探测器(OPD)的基本原理相同,均可以归结为广义的有机光伏器件,其中OSC的研究相较OPD而言更为成熟,已经发展到单结器件光电转换效率达到18%的水平,表明其作为高效的太阳光子能源转换器件达到初步实用的境地。与此同时,随着涵盖光谱范围的拓展以及性能的提高,有机光电探测器的基础研究及相应的应用研究也日益增多,其研究的重点逐渐聚焦在抑制暗电流、提升线性响应范围、提升器件
污水污泥是污水处理的产物。污泥中含有很多细菌,可发酵释放恶臭气体,对坏境造成污染,并影响人体健康。同时,污泥中具有大量重金属,若不妥善处理,将造成地表水污染及土地污染,进而污染水产品或农作物。本文针对污泥减量化、无害化、资源化处置需求,以运行费用低、推广价值高为导向,利用现有城市生活垃圾资源化热力利用优势,提出以污泥为低质燃料,在垃圾焚烧炉中掺混处置发电的技术思路。基于此,本文针对我国生活垃圾焚烧