深度网络结构归一化的研究与应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:wwxx10086
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习和神经网络广泛的应用到了我们的生活之中,其中归一化技术作为推动深度学习的发展起到了举足轻重的作用。其通过将网络中的输入进行归一化从而减少神经网络中的梯度爆炸和梯度消失问题,但是神经网络在添加归一化操作后网络的学习成本依旧很高,需要花费大量的计算机资源进行计算。为此,本文提出了深度网络结构归一化,并从网络结构和数据结构两个角度进行了探索。1.从网络结构层面出发,本文提出了深度网络结构化的权重归一化(Deep Structural Weight Normalization,DSWN),通过将网络结构度量注入到权重归一化中来确保神经网络的数据传播。在DSWN中提出了两种新的结构度量方法,利用不同的惩罚矩阵对每个网络权重施加正则化。一种是稀疏化度量(Sparsity measurement,DSWN-SM),在该度量中,我们将L1,2权重正则化应用到结构化的权重归一化模型中,以促进网络权重之间的特征竞争,从而实现剪枝并获得稀疏网络。另一种是神经元度量(Neuron measurement,DSWN-NM),它利用权重的列向量的L2范数来提高或降低中间神经元的重要性,从而加快了网络的收敛速度。我们在全连接网络和卷积神经网络对多个基准图像数据集进行了大量的实验,并与现有的稀疏性和权重归一化方法进行了比较。结果表明,DSWN-SM能够在保证精度的同时减少网络中的参数,DSWN-NM可以提高网络性能的同时加速网络的收敛速度。2.从数据结构层面出发,本文提出了深度网络去相关层归一化(Decorrelated Layer Normalization,DLN)研究方法,针对卷积神经网络(Convolution Neural Network,CNN),所提方法通过对单个样本所有通道中加入白化(Whitening)操作,在保留原有网络层归一化的基础上进一步减少了输入特征之间的相关性,使得通道上的数据特征表达具有独立同分布的特点,从而降低了输入数据的冗余并最终提升层归一化的泛化性能。在CIFAR-10,CIFAR-100数据集上的实验结果证明本论文所提方法与其他归一化方法在小批量样本场景下相比能够提高2%~4%的图像分类准确率。3.在提出的结构归一化算法的基础上设计并实现了图像识别系统,通过该系统直观的向读者展示本文所提方法的优越性。此系统主要由用户管理模块、网络训练模块、图像识别模块三个功能模块构成。经过多次图像分类结果表明,该图像识别系统构建了方便交互的功能界面,实现了所需功能,验证了所提出的结构归一化算法的有效性。
其他文献
互联网募捐平台作为一种新兴的募捐途径已为大众所熟知,但平台自诞生以来涉平台的失范募捐现象频发,对社会诚信造成了很大的影响,亟需行政机关有效监管。然而,互联网募捐平台用户数量巨大,信息交互频繁,仅靠有限的政府机关行政资源难以全面的监管互联网募捐平台。因此,为规制互联网募捐平台,国家出台了一系列法律法规,以此课予互联网募捐平台行政任务的形式,同行政机关合作规制以规范平台用户行为。在合作规制下,政府机关
2014年,广东省发生的一起劳动争议案件引发了实务界关于“劳动者入职时存在欺诈情形,用人单法是否仍应当支付二倍工资”话题的广泛讨法。在求职阶段,部分劳动者为了获得就法机会,违反诚实信用原则,对于法历水平、工作经验、岗法技能等与履行劳动合同具有直接相关性的重内信息,做虚假陈述或者故意隐瞒,诱导用人单法产生错误认识,违背真实意思与其建立劳动关系。另一方面,部分用人单法缺乏规范用工意识或者为了规避用工风
随着生产自动化和智能化水平的不断提高,智能制造技术已广泛应用于工业生产领域,其具有非接触、高精度、高效率和实时性等优点。目前,在工业生产中,电子元器件的插装主要以人工插装方法为主,这种方法插装效率低且人工劳动强度大,大大降低了电子元器件插装的智能化水平。本课题将点云配准技术应用于散乱电子元器件位姿估计中,对基于点云配准的散乱电子元器件位姿估计方法进行了深入的研究。论文主要工作及结论如下:首先,对双
随着移动互联时代的到来,信息流广告兴起并取得长足发展,成为移动广告的新引擎。与传统互联网广告相比,信息流广告具备内容和形式上的原生性以及投放方式上的动态性等两个重要特征。如何根据流媒体平台的上下文特征和受众所处的场景的时空间特征(如时间压力)来调整信息流广告的形式和内容,在保持原生性的前提下提高信息流广告的传播效果,是实践界和学界都关注的、亟待解决的问题。本文基于解释水平理论,探究信息流广告诉求的
在过去的发展中,建筑业作为中国经济的支柱产业,逐渐形成了从业人数多、规模大、效益低、产业升级难、产业结构不合理、管理水平不高的现状格局。建筑业正从野蛮生长阶段过渡到理性繁荣阶段,产业结构持续调整、利润格局深刻变化。新时代背景下,“调结构、去产能”成为主旋律,建筑行业作为传统发展过剩的产业,面临的市场竞争环境将进一步恶化。中国建筑业央企作为建筑业的支柱和主导力量,在促进中国基础设施建设、促进就业等方
人工智能技术颠覆了传统广告运作中的创作逻辑。研究者以动觉智能图式理论为研究框架,以中国广告市场上的智能创作项目为个案研究对象,分析了文字、图像、视频三类广告的智能创作系统,提炼出广告智能创作的学习、生成与反馈模型,以及贯穿其中的机器创作逻辑。未来广告智能创作有三个重要的发展方向:一是创作内容从传统基础性表达转向人机协同的智能创作;二是创作策略从短期产品创作型转向长期品牌创作型;三是广告公司跨越智能
对外汉语口语课堂是留学生获得口语交际能力的主要阵地,而初级阶段对教师的口语教学能力要求更高。课堂互动是提高口语交际能力的重要因素,对初级阶段口语课堂互动的研究可以帮助来华初级汉语留学生更顺利地进行口语交际,有利于帮助对外汉语教师提高口语课堂的教学效率,因此,对对外汉语初级阶段口语课堂互动的研究非常有必要。本文在建构主义观、输出与输入理论、互动理论的基础上,结合COLT量表对三位教师课堂进行了个案跟
社会的发展必然产生治安问题,尤其是现阶段国内社会发展正处于转型阶段,安全利益需求随着经济架构的多元化发展也逐渐变的复杂化,在治安秩序维护过程中社会治理的多元参与是必然的。从实质上讲,社会的合理管控就是治安,明确和维护治安秩序过程中,极为关键的一项措施就是社会的合理管控,两者存在着内在统一性。若欠缺人民群众的加入,那么在维护治安秩序时,达成社会合理管控的目标的难度就相对较高,而人民群众加入社会治理极
教育功能是博物馆功能的输出终端,近几年随着国内公共文化服务体系的不断完善,博物馆教育项目逐渐成为博物馆教育事业发展的新命题和新方向,是博物馆完成其教育使命的重要举措,博物馆教育项目的管理水平也直接关系到博物馆服务社会的质量。本文围绕博物馆教育项目管理展开详细研究,综合叙述了研究相关的基本概念及理论基础,博物馆与博物馆教育的概念及发展,博物馆互动学习理论及项目管理流程的基础知识。阐述了湖北省博物馆教
2008年铁道部出台我国高铁网络发展建设规划,擘画“四纵四横”高铁规划蓝图,我国进入高铁建设的快车道。截至2020年,我国高铁运营里程已近4万公里,为世界之最。同时高铁开通的经济外部性也逐渐成为学术界关注的热点。高铁开通降低旅途时间成本,提升区域可达性,推动信息要素加速流转,缓解资本市场信息不对称。审计师的工作价值来源于对企业的财务信息进行甄别判断,高铁开通将降低审计人员与被审计企业之间的信息不对