基于隐变量模型的深度学习特征泛化研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:jlq100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习作为机器学习技术的研究热点,其核心是特征学习,通过多层神经网络结构在大量数据中获得不同层次的特征信息,从而有效地解决分类、回归等问题。然而对于部分应用场景,可采集的训练样本集规模较小,若直接进行训练,得到的模型可能产生严重的过拟合现象。因此我们希望利用小规模数据集训练一个高性能的深度神经网络分类/回归模型,尽可能消除由于训练数据量不足带来的拟合缺陷。针对上述问题,本文首先提出了一种基于隐变量模型的特征泛化算法,解决训练数据不足导致模型过拟合的问题;其次提出了两种基于特征泛化层的网络优化方法,用于提升模型的训练效率以及分类准确率。特征泛化算法的核心在于生成模型的构建以及优化目标的确立。基于隐变量模型,本文在深度神经网络中构建一个特征泛化层作为生成模型,此层结构包含一对双向的参数化映射,构成数据空间与隐变量空间的变换关系。算法采用多目标协同优化的思路定义两个目标函数,分别最小化特征泛化层的生成误差与整个网络的分类误差,反向传播阶段两个目标函数分区域对参数进行更新。本文选取不同规模的样本对网络进行训练,实验结果显示添加特征泛化层后,DNN模型的分类准确率在MNIST数据集上的增幅为0.42%-33.33%;Chars74k自然图像数据集上增幅为2.25%-15.5%;Chars74K合成字符数据集上增幅为2.5%-21.25%。仿真结果验证了该算法有利于提升深度网络模型的泛化能力,可以减轻小规模数据训练时存在的过拟合现象,相较于其它使用生成模型增强数据的方法,简化了网络复杂度,提高了训练效率。多分支并行前向传播方法旨在优化模型的训练效率以及收敛性。考虑到网络中特征提取层输出的数据是由多张特征图复合成的矩阵,本方法采用数据分流处理的思路为每张特征图建立独立的泛化分支,降低数据复杂度。网络的生成目标函数由多分支加权平均构成,更加均衡地反应特征泛化层的整体性能。双通道自适应矫正方法旨在提升模型的分类准确度。通过误差衡量,逐级对泛化通道内的特征图进行自适应矫正,将后续特征提取节点输出中存在的生成误差控制在合理的范围内。同时将所有节点的误差累加到网络的目标函数中作为约束项,使生成的特征图更符合原始数据的抽象属性。MNIST数据集上得到的实验结果显示:双通道自适应矫正方法优化后的模型分类准确度最高提升了4.09%;多分支并行前向传播方法优化后的模型训练效率大幅提高,单次迭代耗时仅为前者的45%(25)65%。定性与定量的实验验证了本章两种优化结构的有效性及适用性。
其他文献
通过电化学噪声技术(EN)、动电位扫描法、噪声电阻(Rn)等方法研究了304L不锈钢在含Cl^- 溶液中的腐蚀行为过程,探讨了Cl^- 对304L不锈钢腐蚀行为的影响,以及腐蚀的形成、特征、机
<正>目前,中国是全世界在线教育规模最大的国家。在线教育有力促进了不同区域的教育公平,大大提升了中国教育的整体质量。近日,在线教育平台跟谁学、网易有道、51talk陆续发
组合结构的活塞相较于整体活塞,其明显优势在于可以根据活塞工作时不同零部件的受力特点,采用合适的材质,从而使活塞的设计在保证强度足够高的同时还能拥有相对较轻的重量。
地方性氟中毒是一种生物地球化学性疾病。虽然氟在自然界中分布极为广泛,但只有在特定的地质、水文地质、地理和气候等自然界因素和生产、生活习惯等社会因素的作用下,才能使
阐述了全目制工程硕士研究生培养基地建设的几种模式,介绍了华南理工大学全日制工程硕士研究生培养基地建设实践及取得的成效。
近年来,为解决教育大众化带来的家庭困难大学生上学问题,高校资助体系已逐步迈向成熟。然而,如今高校中却出现了小部分受助大学生不守信、不感恩的现象。这不仅是对社会资源
期刊
阐述了跳汰选煤技术及其设备在我国选煤业的地位,介绍了跳汰选煤理论的新发展,重点展示了跳汰设备的技术进步情况.
人类具有客体性、整体性、主体性、生成性、智能性、一切社会关系的总和性等共性,每个人还有自己的个性.可是我们的当代教育在某种程度上却是不理解人的、片面割裂的、强迫压
球虫病、蛔虫病历来是危害幼畜较严重的2种寄生虫病,当2种寄生虫混合感染时,临床确罕见,危害更加严重。广州地区某奶牛场犊牛群于1998年4月~5月,发生了以拉灰白便、血便、水样便为主症的疾