【摘 要】
:
在最近几年,神经网络已经被广泛的应用于各种回归和分类问题。通过将正则项加入到神经网络的学习过程中,研究者提出了许多正则化技术来处理与神经网络相关的问题。其中,两种经典的正则项(惩罚项)分别是运用L2范数和运用L1或L1/2范数。L2范数的功能主要是获得有界的网络权值并提高网络的泛化能力。而L1或L1/2范数的功能主要是使网络具有稀疏性,以便减少神经网络使用的节点和权值,与此同时并不引起对网络效率的
论文部分内容阅读
在最近几年,神经网络已经被广泛的应用于各种回归和分类问题。通过将正则项加入到神经网络的学习过程中,研究者提出了许多正则化技术来处理与神经网络相关的问题。其中,两种经典的正则项(惩罚项)分别是运用L2范数和运用L1或L1/2范数。L2范数的功能主要是获得有界的网络权值并提高网络的泛化能力。而L1或L1/2范数的功能主要是使网络具有稀疏性,以便减少神经网络使用的节点和权值,与此同时并不引起对网络效率的破坏。本文考虑高阶神经网络(HONNs)的正则化方法。研究者已经证明,HONNs在许多方面比普通的一阶网络更高效。从一些方面来讲,稀疏化对HONNs更重要,因为通常情况下HONNs中有更多的节点和权值。特别地,本文考虑pi-sigma神经网络(PSNNs)和 sigma-pi-sigma 神经网络(SPSNNs)。本论文的主要内容如下:1.在第2章,本文研究用于PSNNs的带L2内惩罚的在线梯度算法。这里,L2范数是关于每个Pi节点的输入值的。证明了误差函数的单调性、权值的有界性以及弱收敛定理和强收敛定理。2.在第3章,本文描述了另一种用于PSNNs的L2内惩罚。不同于第2章,本章中L2范数是关于网络中每一个权值的。证明了批处理梯度算法的收敛性。并证明了在训练迭代中带惩罚项的误差函数的单调性,以及权值序列的一致有界性。将该算法应用于求解四维奇偶问题和Gabor函数问题以支持我们的理论结果。3.在第4章,提出了一个带光滑L1/2正则化的离线梯度法来训练和修剪PSNNs。因为涉及绝对值函数,原始L1/2正则项在原点不光滑。这会导致计算中出现振荡现象,并且非常难于进行收敛性分析。本文提出了使用光滑函数代替并近似绝对值函数,得到一个PSNNs的光滑L1/2正则化方法。数值模拟表明,光滑L1/2正则化方法消除了计算中的振荡,得到更好的学习准确率。我们也能够证明所提出的学习方法的收敛性定理。4.在第5章,本文考虑更重要的Sigma-Pi-Sigma神经网络(SPSNNs)。在现有文献中,为了减少Pi层中Pi节点的个数,在SPSNNs中,研究者采用了一种特殊的多项式Ps。当令其他的变量都是常数时,Ps中每个多项式关于每一个特定的变量σi都是线性的。这种选择可能是直观的,但未必是最好的。本文提出了一种自适应的方法来寻找一个给定问题的更好的多项式。为了阐明提出的方法,本文从一个确定阶数的完整多项式出发。然后,在学习过程中对给定问题,采用正则化技术减少所需多项式的数目,最终得到一个新的SPSNN,其所用的多项式的数量(=Pi层中的节点数)和Ps中多项式的数量相同。一些基准问题的数值实验表明,新的SPSNN表现比带多项式Ps的传统SPSNN好。
其他文献
纳米器件具有灵敏度高、选择性强、功耗低等特点,在电子信息、生物医疗、环境能源等领域具有广阔应用前景。纳米尺度结构是纳米器件的基础,是实现纳米器件高性能的关键。目前,纳米尺度结构的制造过程普遍需要借助昂贵的聚焦离子束、电子束曝光、纳米压印等设备和多层套刻、结构转移等复杂工艺步骤,其工艺流程复杂、效率低、成本高,阻碍了纳米器件的广泛应用。本文基于电流体动力理论和多物理场复合作用,研究了电场-流体复合约
奥氏体不锈钢经等离子体基低能离子注渗工艺处理后可以形成氮超高过饱和(10-35 at.%)渗氮层。该渗氮层是非均匀的亚稳单相,耐磨抗蚀性能远优于奥氏体不锈钢,在核工业中具有广阔的应用前景。然而,与渗氮层优异性能相对的是,渗氮层晶体结构存在争议,缺乏原子尺度结构模型,制约了对渗氮层相稳定性和结构稳定性的认识,从而限制了这项技术在核工业关键零部件中的应用。本论文从奥氏体不锈钢过饱和渗氮层显微组织结构入
在过去的20多年里,非标准增长条件的偏微分方程和变分问题,以及相应的变指数空间理论是非常有吸引力的研究课题。这些研究都涉及了非弹性力学、电流变流学、图像处理等实际问题。本文的研究也密切此领域,具体地,本文研究了p(x)-Laplace方程Robin边界条件下的特征值问题,包括特征值的存在性问题和稳定性问题。另外,为了研究p(x)-Laplace方程Dirichlet边界条件下第一特征值的性质,证明
激波是可压缩流动中的一种重要间断现象,越过激波流动参数发生突跃,而且随之还有机械能的损失,是个不可逆的过程。在含有激波的流动模拟中,对于激波的处理是极为重要的。激波装配方法是一种古老的激波求解方法,其理论基础较为清晰合理。在计算流体力学(Computational Fluid Dynamics,CFD)发展的初期就已经被用于来处理含有激波的可压缩流动。在处理含有简单激波的流动时,激波装配有着较为突
典型李超代数可分为基本典型李超代数和奇异李超代数,其中基本典型李超代数包含:单李代数,A(m,n),A(n,n),B(m,n),C(n),D(m,n),G(3),F(4)和 DD(2,1,α);奇异李超代数包含两类:P(n)和Q(n).用К表示除A(n,n)和单李代数之外的基本典型李超代数.单李代数的每个局部导子或者2-局部导子都是导子,本文将李代数的局部导子和2-局部导子的定义推广到李超代数上,
无单元伽辽金法(Element-Free Galerkin method,EFG)是近二十余年逐步发展起来的一种无网格方法,由于其具有不依赖于网格单元建立近似函数、易于构造高阶近似以及形函数高度光滑等优点,因此在裂纹扩展、自适应分析、板壳计算以及大变形模拟等方面展现出显著的优势,极具发展潜力。然而,由于无单元伽辽金法的形函数为非多项式的有理函数,弱形式的数值积分难以准确计算,需要采用较多的数值积分
6月28日,江南公交在沙洲停车场举行了2019年度安全月主题活动暨防恐防暴应急处置、消防演练,除常规油盆灭火项目以外,"车危仪"作为技防新设备首次参与演练。从7月开始,南京江南公交在1路、2路、3路、33路等主城8条线路上陆续安装221台"车危仪"。
重庆市荣昌县有效运用"加、减、乘、除"四方面,积极落实安全防护措施,筑牢安全屏障,实现市级平安校园创建率达100%、校园安全责任零事故的目标。建制度、抓落实,安全管理体系更"加"完善为进一步强化安全工作"一岗双责"制度,重庆市荣昌县建立起"两重两抓"的管理机制。一是重责任抓监管。荣昌县实行分级管理、逐层负责、全员参与的划片包干制,从教委分管领导至学校任课教师一级均有明确的岗位安全职责;采取了
岩土材料作为一种天然的孔隙材料,力学性质十分复杂,难以用普适性的理论来描述其强度和变形性质。本文从强度和变形这两个岩土力学中最基本的问题入手,通过试验研究了岩土材料在复杂应力状态下的强度特征和弹性参数的变化规律。首先是发展了岩土材料的保罗莫尔库仑准则。该强度准则包含全部三个主应力和三个强度参数:三轴压缩和伸长内摩擦角φc、φe和等向抗拉强度V0,物理意义明确。提出了一种平面拟合方法来确定强度参数,
微热管(Micro Heat Pipe,MHP)是一种常用的被动热管理方法,广泛应用于半导体器件中。本文采用微机电系统(MEMS)方法设计和制作了各种硅基微热管,对其传热性能进行了研究。微热管的基本传热依赖于两种机制:工质的相变传热和通过固体壁的热传导。因此,工质和毛细管结构是微热管工作性能的两个重要影响因素。微热管中的微槽起到了毛细结构的作用,主要是产生毛细泵送压力,使冷凝液返回蒸发段。因此,微