通过逐层训练探索神经网络

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ldpjk77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习的飞速发展为人类生活的方方面面提供了很多便捷,人们希望能对深度学习有更多的了解,从而能够更好地利用且改善神经网络。通用逼近定理认为一个前馈神经网络如果具有线性输出层和至少一层具有任何一种“挤压”性质的激活函数的隐藏层,那么只要给予网络足够数量的隐藏单元,它就可以以任意的精度来近似任何从一个有限维空间到另一个有限维空间的Borel可测函数。但是现实中如果我们只使用具有一层隐藏层的网络去获取目标特征的话,结果经常不尽如人意,本文的目的是通过逐步加深网络来反复的修正特征,直到得到的属性特征趋于稳定,并且可以获得一个令人满意的识别结果。本文所进行的实验属于图像识别领域,实验采用的数据集包括MNIST、Fashion MNIST、CIFAR10、CIFAR100,实验中利用的方法是贪婪逐层预训练,具体来说是训练好基础网络后保留基础网络的参数,然后再逐步加入新的网络层,并对新的网络结构重新训练,以此类推,直到最后获得稳定的属性特征。实验中选取的骨干网络为残差网。在使用贪婪逐层预训练的技术进行逐层添加的过程中,新加入的残差块会导致最新网络的全连接层接收的特征图数量是上一网络全连接层的两倍,也就是说最新网络的全连接层参数是上一网络全连接层参数的两倍,所以如果继续直接使用上一网络的全连接层会造成维度不匹配的情况。本文提出了两种想法来解决这个问题,方法一是新网络的全连接层一半参数使用上一网络全连接层的参数,另一半参数使用随机初始化来补全,方法二是保留上一网络除了全连接层以外所有层的参数,然后利用随机初始化为新网络全连接层的全部权重赋以新的初值。在CIFAR10数据集上,本文用以上两种方法分别做了实验,第一种方法的TOP1精度可达82.3%,第二个方法TOP1精度可达81.5%,所以第一种方法更加优秀。除此之外,本文根据前辈的经验从三个方面对逐步加深网络实验从精度方面进行了改进,包括使用三层卷积来增加感受野,使用池化层来下采样和加入SEblock,并通过消融实验表明这些方法对最后的精度都有所提升。在最后,使用上述的所有技巧和方法一构建新的网络,结果为在CIFAR10数据集上随着残差块的逐块添加,最后的TOP1精度逐渐提高,分别为0.769,0.841,0.842,0.843,成功的将属性特征进行了逐步修正,从而使结果逐步提升。
其他文献
背景:肌少症是一种与年龄有关的健康状况,正常人从30岁开始肌量每年丢失约1%~2%,到80岁时,超过30%的肌量已流失。根据人种和诊断肌少症的方法不同,肌少症的发病率大约在10%~25%,但在80~89岁的老年人中发病率可高达50%。维生素D缺乏是一个全球性的健康问题,老年人由于自身活动受限制、维生素D摄入或合成少及慢性疾病等影响,维生素D缺乏较常人更为常见。研究显示我国70%~90%的60岁以上
以提高在线健康用户信息服务质量为目标,并对有健康信息需求的用户提供个性化信息支持和情感支持,以帮助他人获取高质量健康信息、提高健康素养、科学决策并有效处理健康问题。将健康信息替代搜索行为作为研究主题,根据计划行为理论和健康控制源信念为理论基础,参考计划行为理论经典模型,分析在线健康信息替代搜索者对网络健康信息的态度、健康控制源信念、健康信息替代搜索行为及与信息共享行为的相关影响因素。数据来源自行设
学位
井中磁测是勘察地球资源的重要手段之一,以矿产资源的磁性特点为研究基础,能勘探出井周围一定规模内的盲矿以及含磁性矿产物质的空间位置,可以免除地面人文、地形环境等多因素的干扰,为普查磁铁性矿产、探寻深部有色金属矿产提供有效的技术支撑。井中磁测发展必然趋势之一是观测物理量的阶次不断增高,从测量地磁总场强度标量,发展到测量磁场矢量,再到测量其磁梯度张量。观测物理量的阶次提高能有效克服地球磁场自身随时间变化
随着社会的进步,汽车也向着安全、节能和个性化方向发展。在汽车外流场空气动力学中,车轮作为外流场唯一做旋转运动的主要部件,会对其周围的流场产生巨大影响。因此,单独研究车轮的空气动力学性能,即旋转独立车轮气动特性研究,无论是对车辆周围流场结构及气动力研究,还是作为整车车轮区域流场的先导研究,均具有重要的意义。本文基于商用计算流体力学(CFD)软件STAR-CCM+,并引入参数化思想和软件二次开发技术,
近年来,随着科学的发展和社会的进步,互联网行业高速发展。这种时代背景的改变虽然提高了人们的生活质量,加快了社会进步的步伐,但同时也给人们带来了一些困扰。在这种信息大爆炸时代,信息严重过载,致使人们无法快速准确地在大量的信息中找到自己想要的那部分。为了解决上述问题,推荐系统由此诞生。传统的推荐算法主要分为三类:基于内容的推荐算法,协同过滤推荐算法以及基于混合的推荐算法。虽然这三类推荐算法各有千秋,但
5G和IPv6等技术的发展,促进了物联网设备联网能力,物联网逐渐发展,使得物联网设备也急剧增多,最近,针对物联网设计的病毒也越来越多。同时使用被攻破的物联网设备进行DDo S等网络攻击具有巨大的威力并能造成严重的后果。蜜罐,作为一种研究网络安全形势的工具,将其引入物联网中,可以用来尝试解决目前物联网领域面临的严峻的安全挑战。传统的蜜罐设计是将一个真实的物联网设备通过网络工具映射到公网之上,虽然其能
学位
目的:本研究旨在使用Meta分析的方法评估拉曼光谱技术对乳腺癌的诊断价值。方法:在线检索EMBASE、PubMed数据库、The Cochrane Library、Web of Science、中国知网(CNKI)、中国生物医学文献数据库(CBMdisc)、万方数据库,查找利用拉曼光谱技术诊断乳腺癌的相关文献。检索时间均由建库开始到2020年11月。根据事先确定的文献纳入和排除标准进行筛选,并使用
目的:本研究拟利用漫反射光谱技术筛选用来判断直肠癌组织和正常直肠组织的差异性光谱,并利用差异性光谱比较距直肠肿瘤不同距离的直肠组织光强度情况,用以确定直肠癌光谱学角度的安全切缘,从而为判断直肠癌肿瘤安全切缘提供方法。方法:应用光谱技术对收集的68名直肠癌患者共544个组织样本(每名患者分别留取8个组织样本:分别为肿瘤中心组织、距肿瘤0.5cm、1cm、1.5cm、2cm、2.5cm、3cm、5cm