卷积神经网络中新型激活函数的研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:foranjay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
更快、更好的卷积神经网络(Convolutional Neural Networks,CNNs)架构一直是研究的热点。不管CNNs架构如何变化,激活函数都是必不可少的。修正线性单元(Rectified Linear Unit,Re LU)被广泛应用在绝大多数CNNs中。过去这些年,许多单调激活函数被提出,尝试取代Re LU。然而,这些单调激活函数在不同数据集和CNNs上表现得不稳定。Softmax也被广泛使用在CNNs中。但是,对于较大的正输入,Softmax很容易发生计算溢出由于其包含指数运算。首先,针对大多数单调激活函数在不同数据集和CNNs上表现不稳定的问题,本文提出了两个新型非单调激活函数,分别被命名为幂函数线性单元(Power Function Linear Unit,PFLU)和更快速的幂函数线性单元(Faster PFLU,FPFLU)。PFLU的负区间是非单调的,且随着负输入的减小逐渐趋于零,这样可以为负区间引入负激活值和非零导数,同时保持负区间的稀疏性。PFLU的正区间是单调的,且随着正输入的增大逐渐趋于恒等映射,这样可以为正区间带来更多非线性。和PFLU不同的是,FPFLU的正区间使用恒等映射。和PFLU相同的是,FPFLU的负区间也是非单调的。然后,针对Softmax对于较大正输入很容易发生计算溢出的问题,本文提出了计算更安全的HardSoftmax,并进一步提出了基于HardSoftmax的并行选择核(Parallel Selective Kernel,PSK)注意力。不同于选择核(Selective Kernel,SK)注意力将全局特征的提取和转换放在特征融合之后,PSK注意力将全局特征的提取和转换单独放在一个分支,与具有不同核大小的多个分支构成并行结构,且全局特征转换使用分组卷积,从而减少参数量和计算量。同时,PSK注意力通过HardSoftmax注意来关注不同核大小的多个分支。一系列的图像分类实验表明,PFLU趋向于比现有的、最高级的非单调激活函数表现得更好;FPFLU在实验中也比大多数非单调激活函数运行得更快。实验也表明,只是简单地用HardSoftmax替换Softmax,也能保持或提升原注意力的性能。HardSoftmax的运行速度在实验中也比Softmax更快速。PSK注意力能够以更少的参数量和计算量追平或超越SK注意力。本文的部分成果也已发表在SCI期刊和中文核心期刊上。
其他文献
互联网飞速发展,大数据时代降临,庞大的数据资源推动了各个产业的量化进程,但同时也带来了信息过载的负面影响。推荐系统的出现正是为了解决信息时代的信息过载问题,个性化推荐技术的发展则提升了用户获取所需信息的体验。大数据时代下,数据量庞大但数据内容稀疏是推荐算法进行数据分析时遇到的经典问题,为了提升推荐性能以及用户满意度,挖掘更多用户与项目之间的联系是推荐算法研究学者的关注热点。推荐系统中,评分数据往往
Android恶意应用检测是保障用户信息安全的重要方法。为提高Android恶意应用检测的准确性,从特征选择、不平衡学习、对抗攻击三个角度进行了研究,提出了面向Android恶意应用静态检测的特征频数差异增强算法、基于不平衡学习的Android恶意应用检测方法、基于特征选择的Android恶意应用对抗样本生成和检测方法,通过实验及开发的APK检测工具和网站验证了方法有效性。主要研究工作和成果包括:
近重复文本图像检索在文本图像分析与理解中起着非常重要的作用,而且在很多领域有着迫切的实际应用需求。传统近重复文本图像检索方法需要人工事先确定近重复图像之间存在的变换类型,并根据变换类型选取合适的特征来描述图像。由于传统方法受人工影响大、主观性强,本文聚焦于基于深度学习的近重复文本图像检索问题,研究内容主要包括以下两个方面。首先,本文提出一种基于分类卷积神经网络的近重复文本图像检索方法,使用卷积神经
随着深度学习技术的发展和成熟,深度学习技术被广泛的运用于各个研究领域,使得许多领域都有突破性的进展,尤其是在计算机视觉领域。在计算机视觉中图像风格迁移学习是一个热门研究方向,图像风格迁移可以使图像转换风格,而图像内容保持不变。风格迁移学习主要通过两类损失函数:内容损失函数和风格损失函数来训练模型,使得生成的图像风格转换为目标图像,而内容则保持和原图一样。面部表情识别技术是属于模式识别、情感计算等学
生物特征(人脸、指纹、虹膜等模态)识别极具发展前景的新型身份认证方式。与其他模态相比,掌纹包含丰富的鉴别性特征、用户接受性强、隐私性高等优点,逐渐成为近年来的研究热点。编码类掌纹识别算法具有无需训练,非数据驱动,存储量低并且匹配速度快等优势,是一种重要的实用化主流技术。在编码类掌纹识别算法中,通常将掌纹图像均匀划分为4×4个像素的子块,每个子块下采样为一个特征点,因此模板尺寸仅为原始图像的1/16
利用区块链技术解决第三方信任危机和数字安全隐患问题,是当前电子数据存证系统的研究热点之一。本文针对实用拜占庭容错算法延展性差、通信开销大、效率低及无法动态增加节点等问题,应用最大容错理论,研究提出了基于权重视图切换与两阶段共识策略的WPBFT~1算法以及基于共识信息同步与WPBFT的RW-BFT算法,设计实现了基于RW-BFT~2共识机制的电子数据存证系统。主要研究工作和成果包括:1.提出了一种基
近年来,我国各地区用电负荷总量持续攀升,电力市场的供需不平衡问题持续升级。再者,当前的电力需求侧管理工作落实不到位,资源配置不合理。在电力资源有限的情况下,实施有序用电是缓解高峰时期电力供需矛盾最直接有效的负荷管理措施。为了提高电力资源的使用率,对电力用户侧负荷数据的价值挖掘是对用户用电行为分析的基础,根据不同类型用户实施差异化的需求侧管理工作也是当前电网研究的热点课题之一。本文的主要工作内容有:
随着互联网的蓬勃发展,网络中传输的数据信息数量也在爆炸增长。图像作为数据信息的主要表达形式之一,一旦被不法分子窃取或破坏,轻则带来巨大的经济损失,严重则会威胁到国家安全。因此,针对数字图像设计安全有效的加密算法具有重要的学术意义和实际应用价值。本文以混沌系统和DNA编码技术为切入点,针对灰度图像和彩色图像设计了两种加密算法,并对其进行了性能评估实验。主要内容如下:(1)针对使用静态DNA编码的图像
2021年,面对复杂多变的国内外形势和各种风险挑战,我国印染企业积极调整发展战略,印染布产量保持了良好增长态势,主要产品出口规模较疫情前进一步扩大,主要经济指标持续修复,企业盈利水平明显改善,行业表现出强大的发展韧性,实现了"十四五"良好开局。但也要看到,当前全球疫情仍未得到有效控制,大宗商品价格虽有回落但仍处于高位,纺织产业链供应链衔接仍不够顺畅,行业实现全面复苏的基础仍需进一步巩固。
期刊
由于蛋白质结构与功能、进化研究的密切关系,蛋白质结构比对成为生物信息学领域一个基本而重要的问题。蛋白质结构比对方法的研究对丰富和发展蛋白质结构分析的理论基础,解释蛋白质结构与其功能、进化的内在蕴含,促进蛋白质结构预测、药物分子设计等有着重要的科学和现实意义。本文围绕蛋白质结构比对问题进行了研究,主要内容如下:(1)在广泛阅读国内外有关蛋白质结构比对文献基础之上,对已有结构比对方法进行总结。依据蛋白