基于光滑L0正则子的神经网络稀疏化梯度学习算法研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:sheryme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学家们在探索人类大脑的过程中形成了一门新的学科一一神经网络,近年来在各个领域得到了广泛应用。前馈神经网络是一种重要的神经网络模型,而基于梯度信息的BP算法是最为流行的神经网络学习算法。人们在梯度算法的基础上提出各种改进方法,其中运用较多的一种方法是基于正则化思想的网络剪枝方法,其通过在误差函数中添加正则项,使多余单元的权值趋于零,并对权值趋于零的单元剪枝,从而达到减小网络的复杂度,提高网络泛化能力的效果。L0正则化方法具有最优的稀疏性,但其求解是NP难问题,难以和神经网络的学习算法进行结合。本文利用光滑函数序列对L0正则子进行逼近,进而提出一种带光滑Lp正则项的梯度学习算法,并对算法的稀疏性、收敛性进行理论分析。本文第一章介绍神经网络的发展历程,神经网络的学习方式和学习算法,以及梯度学习算法,并在此基础上对Lp正则化方法作详细介绍;第二章研究带光滑L0正则项的批处理梯度学习算法,同时建立了算法的稀疏性、收敛性结果及其数学证明,并通过数值实验对理论结果进行验证;第三章研究带光滑L0正则项的在线梯度学习算法,同时建立了算法的收敛性理论,并通过数值实验验证了相应的理论结果;第四章对全文进行了总结。
其他文献
自从上世纪60年代以来,重尾分布已经在分支过程,排队论,风险理论包括金融等领域中有了广泛的应用。特别地,重尾分布在保险领域有其特殊的地位。在财产保险业中,重尾分布(如次指数
在20世纪40年代Ito和Gilman的奠工作以来,随机微分方程的理论被广泛研究随机微分方程解流的性质在20世纪80年代左右由Elworthy,Bislrtut,IkedaWatanabe,Kunita,Meyer等研究.在方
TSP问题在图论的意义下就是最小Hamilton圈问题,是组合优化领域的重要问题之一,它有着广泛的应用,因而对其开展深入广泛的研究具有重要的理论价值和实用意义。 本文主要工作