基于自编码器结构的无监督学习算法研究及其应用

来源 :西安电子科技大学 | 被引量 : 1次 | 上传用户:cygggg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习特别是深度学习理论和算法的不断发展,为了充分利用无标签数据,无监督学习算法取得了长足的进步。基于自编码器结构的无监督学习算法通过重构输入分布,能够提取数据的通用特征表示并有效地对数据进行压缩,并取得了相当的研究成果,但是其中仍然存在一些值得研究的关键问题。首先,基于自编码器结构的无监督学习算法在预训练阶段易受训练数据中异常值的影响,导致提取的特征缺乏鲁棒性;其次,在使用自编码器进行稀疏特征提取时,由于需要调整的超参数较多,使得算法训练复杂度较高;最后,在进行图像补全等图像生成任务时,传统的算法由于高维空间的解析力不足,导致生成的图像会出现结构不清晰以及纹理细节不足的问题。基于自编码器结构的无监督学习属于机器学习领域中的前沿研究课题,是通向强人工智能的关键。但是传统基于自编码器结构的无监督学习算法在鲁棒特征提取、稀疏特征提取以及图像生成方面并未达到预期的效果。因此,针对这些问题,本文分别基于相关熵的损失函数抑制数据异常值、神经元竞争激活机制以及线性逆问题的正则化原理提出了改进算法,对基于自编码器结构的无监督学习算法的研究和应用具有指导意义。本文的主要研究工作及贡献如下:1.通过对无监督学习算法核心技术的剖析,提出了基于自编码器结构的无监督学习算法理论框架。首先,阐述了神经网络的基本理论;其次,对自编码器算法的基本框架以及典型结构进行了分析研究;然后,分析了生成对抗网络的基本理论;最后,提出了基于自编码器结构的无监督学习算法理论框架。2.针对自编码器预训练阶段易受训练数据异常值影响的问题,根据相关熵的原理,提出了一种基于相关熵的收缩自编码器鲁棒特征提取算法(Correntropy-basedContractive Autoencoder,C-CAE),依据相关熵损失函数对训练数据中异常值的抑制能力,以及收缩自编码器对于扰动的正则作用,共同抑制数据中异常值对于自编码器预训练阶段特征质量的影响,可以应用在图像分类和重建等下游任务中。首先,推导了相关熵损失函数抑制训练数据异常值的原理;然后,分析了收缩自编码器的网络结构以及优化方法;最后,构建C-CAE基本结构以及堆叠C-CAE模型,并给出了对应的训练算法。实验验证了基于相关熵的收缩自编码器鲁棒特征提取算法能够有效地抑制训练数据异常值对特征提取的影响。3.针对传统稀疏特征提取算法超参数较多,训练复杂度高的问题,根据神经元竞争激活机制,提出了一种基于稀疏目标矩阵生成的稀疏特征提取算法(Sparse TargetMatrix Generation Based Sparse Feature Learning Algorithm)。该算法通过神经元之间的竞争激活机制构建稀疏目标矩阵,降低了无监督稀疏特征学习算法的训练复杂度。首先,分析了稀疏特征提取的相关算法;然后,探讨了神经元之间的竞争激活机制;最后,在稀疏特征提取与神经元竞争激活的基础上构造稀疏目标矩阵,并通过最小化竞争层输出与稀疏目标矩阵之间的距离提取稀疏特征,为解决图像分类等下游任务提供基础。实验验证了基于稀疏目标矩阵生成的稀疏特征提取算法的有效性和普适性。4.针对自编码器在图像补全任务中出现的生成图像结构不清晰以及纹理细节不足的问题,提出了一种基于边缘和颜色先验的图像补全算法(Parallel ImageCompletion with Edge and Color Map,PIC-EC),该算法使用生成对抗网络从数据中学习图像缺失的边缘和颜色信息,并将其作为图像补全网络的先验知识,提升了图像补全算法的性能。首先,分析了图像补全问题的相关背景;然后,对图像补全问题进行数学建模,分析了模型的求解方法以及图像边缘和颜色先验信息在图像补全问题中所起到的作用,研究了图像补全问题的处理过程;最后,根据对图像补全问题的分析提出PIC-EC算法框架,它包括三个部分:边缘生成网络、颜色生成网络和图像纹理细节补全网络,每个部分都是基于卷积自编码器结构的深度网络。实验表明,PIC-EC算法在补全图像结构完整性、颜色准确性和纹理细节方面获得了比较好的性能,表明了基于自编码器结构的无监督学习在处理具有挑战性的任务时具有优秀的性能。
其他文献
图像自动标注(AIA)技术为海量图像的快速、低成本文本标记提供了支持,使其在航空航天、军事目标检测、生物医学影像处理、城市交通和公安监控等应用中更加方便、快捷、准确。
2017版普通高中英语课程标准提出了立足学生发展的学科核心素养育人观,明确了英语学科核心素养由语言能力、文化意识、思维品质和学习能力四大要素构成。语言能力强调要培养学生综合性语言运用能力,即以听、说、读、看、写的方式理解和表达意义的能力。写作作为语言基本技能之一,是发展英语语言运用能力的基础,也是其中较难的一个环节。然而在调查研究中发现传统的写作教学方法仍被广泛应用且难以满足学生发展的需要。基于此
学位
20世纪90年代以来,企业的外部环境正经历着深刻变化,企业竞争的重点由外部转向内部,提升企业核心竞争力及可持续发展显得尤为重要。21世纪初,中国加入世界贸易组织(WTO),进一
随着移动互联网和智能移动终端的蓬勃发展,出现了分辨率多种多样的显示设备,需要有一种图像尺寸变换方法将图像适配于各种分辨率和纵横比之上。由于传统的尺寸变换方法如直接
市场社会主义是国外马克思主义中具有较大影响力的一股力量,它提出将市场和社会主义相结合的口号,以实现经济效率和社会平等相统一的目标。市场社会主义对中国特色社会主义的
股票市场的参与主体及其影响因素之间存在复杂的非线性相互作用,进而实现信息的交互、流动、反馈、制约等行为。股票市场的结构及演化信息可以通过股票的价格波动反映,而股票价格波动多具有非线性和非平稳性等复杂特征,导致传统的线性分析方法失效。作为股票市场的重要参与主体,投资者是决定股票市场演化行为和股票价格波动的关键因素。投资者的有限关注是获取投资信息的重要途径,反映投资者对股票市场的关注程度,是行为金融理
土壤呼吸作为陆地生态系统和大气间第二大碳通量,其中大约有50%以上来自土壤微生物的矿化作用,在调节全球生态系统碳循环的过程中占有重要地位。但传统对土壤呼吸的研究仅关
房山区内教师计算机拥有量基本达到100%,而数字化办公也已经基本实现,全区学校校园网基本都在运行,校校通工程也基本已经完成,教育信息化程度逐渐加强。虽然投了大量的资金进
“设神理以景俗,敷文化以柔远。”南齐王融《曲水诗序》中的这句话,道出了文化对人的精神思维、社会能力培养的深远影响和作用。十九大明确提出实施乡村振兴战略,这是决胜全面建成小康社会、全面建设社会主义现代化国家的重大历史任务,是新时期推进“三农”工作的总抓手。实行这种战略,润物无声的文化精神力量的复兴,必当先于乡村。乡土文化活动是乡村文化建设的重要途径和载体,如何基于村民需求支持和引导村民开展积极的群众
目的:研究全身麻醉前静脉输注5%葡萄糖氯化钠溶液对腹腔镜胆囊切除患者术中应激反应的影响。方法:选择2018年7月至2018年12月我院腹腔镜胆囊切除术治疗的患者56例,禁食8h,禁饮6h。采用随机数字表法分为2组,生理盐水组(N组)和葡萄糖组(G组),麻醉前1小时按5ml/(kg.h)静脉输液,生理盐水组(N组)输注0.9%氯化钠溶液,葡萄糖组(G组)输注5%葡萄糖氯化钠溶液(由0.9%氯化钠溶液