面向小样本学习的动态分布校正方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:rurucaihongru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然深度学习算法在图像分类中应用非常广泛,然而因为在实际场景中,获取标注数据的成本非常大,所以难以收集到足够多的标注数据来训练分类模型,模型往往陷入过学习或欠学习的问题。另外,目前大部分机器学习算法都难以有效地从数量有限的样本中学习好的图像分类模型的能力。因此,小样本学习依然是图像分类问题的研究重点之一。本文提出了基于幂阶变换技术和标准化技术的动态分布校正样本生成方法以及改进的反陷入GAN样本生成方法,首先利用大样本类即基类样本的特征分布校正小样本类即新类样本的特征分布,然后利用校正后的特征分布进行采样以增广新类数据,从而避免因为样本量过少而导致过拟合或欠拟合的问题。本论文基于该思想进行了如下两方面研究:(1)面向小样本学习的动态分布校正方法研究基于“两个类别相似时,其样本特征分布也具有一定的相似性”的假设,人们利用基类的分布特征对相似新类的分布特征进行校正,从而达到新类数据增广的目的。为了防止在分布特征校正过程中引入负迁移,从而导致新类丢失了自身重要的特征信息的问题,同时为了避免引入噪声,本文提出了动态分布校正方法。首先,基于距离阈值动态选择新类邻域内的基类以及远域内的最远基类形成候选基类。然后,通过预训练的特征提取模型提取候选基类和新类的样本特征向量,并使用幂阶变换和标准化对新类样本特征向量进行预处理以消除不同特征量纲的影响。最后,利用校正超参φ基于候选基类在嵌入空间的分布特征来校正新类中各个样本的分布特征,并利用校正后的分布特征对新类的样本集合进行增广。通过数据集miniImagenet和CUB上的大量实验结果表明,本文提出的这种动态分布校正的方案能够有效提高小样本分类任务的性能,其准确率提高了1%~4%。(2)基于改进反陷入GAN动态分布校正方法研究为了避免数据增强的方法得到的新类样本过于相似而失去类内样本多样性的问题,本文提出基于改进反陷入GAN的动态分布校正方法对新类样本集进行增广。首先,利用本文提出的动态分布校正方法对新类的样本分布进行校正,然后使用改进的“反陷入”正则化和改进的分类正则化来辅助增广新类的样本,以在满足样本量的基础上提升样本之间的多样性。通过数据集miniImagenet和CUB上的大量实验结果表明,本文提出的基于改进反陷入GAN的动态分布校正方法能够有效提高小样本分类任务的性能,与对抗性特征幻觉网络比较,其准确率最高可提升17%。
其他文献
数据隐藏技术作为一种重要的信息安全技术,随着互联网的快速发展而受到广泛的研究,它利用多媒体数字信号的信息冗余性,在不被发现的情况下将秘密数据嵌入到载体中。虽然大多数数据隐藏方法都可以完全恢复嵌入的数据,但通常会对宿主图像等载体造成一定程度的破坏。为了克服这一缺点,近年来人们提出了一系列可逆数据隐藏方法。标记主机图像的失真度较低,不会引起窃取者的注意。本文结合预测误差和直方图移动提出了以下三个算法,
学位
近年来,随着遥感技术发展,高光谱遥感技术凭借其优势成为该领域主要研究方向之一。高光谱遥感技术利用连续且窄光谱通道对目标地物连续成像,与传统遥感技术相比,利用该技术获取的遥感图像能提供目标地物丰富光谱信息,受到学者广泛关注。高光谱处理技术中一项重要研究是分类,目前在农业、医学、城市规划等领域有着重要应用前景。然而图像分类技术也存在诸多难题,例如:获取标签样本代价高、高光谱图像标签样本有限,这与其高维
学位
黄苞大戟(Euphorbia sikkimensis)是大戟科(Euphorbiaceae)大戟属(Euphorbia)植物,在中国广西、贵州、湖北、四川、云南和西藏等地广泛分布。其根入药,常用于肾炎水肿、腹胀、便秘、疟疾、风湿和黄疸等疾病的治疗。该属植物的主要有效成分为二萜类化合物,具有抗肿瘤、抗炎、抗菌、抗HIV等药理活性。黄毛翠雀花(Delphinium chrysotrichum)是毛茛科
学位
智慧体育的兴起,带动了运动事业的发展。当前用户一般通过运动平台或私人教练两种方式获取运动方案,然而前者存在个性化不足,后者存在时效性差等问题。因此,本文针对个性化运动减肥需求,构建了一种基于改进人工雨滴算法的减肥运动处方生成模型,在此基础上设计并实现了个性化减肥运动处方应用系统。主要研究内容如下:首先,针对当前减肥运动处方在实践应用过程中实用性和适用性不足的问题,设计了一种减肥运动处方生成模型。该
学位
2020年政府工作报告强调,要立足于我国巨大的内需市场潜力,使提振消费与扩大投资有效结合、相互促进。同年7月21日,习近平总书记在企业家座谈会上指出,要构建“国内大循环为主体、国内国际双循环相互促进的新发展格局。”在当前世界形势正经历百年未有之大变局,我国国内经济形势面临深刻转型的关键阶段,构建新发展格局,着力扩大内需是对于我国未来经济发展的重大战略部署,如何于新的历史方位中开新局、育新机,在新时
学位
随着互联网的高速发展,旅游信息爆炸式增长导致“信息过载”问题愈发严重,旅游推荐系统研究受到广泛关注。学者们通过加入辅助信息缓解旅游推荐中存在的数据稀疏问题。针对现有推荐模型对多源异构辅助信息建模能力不足问题,本文提出基于图注意力网络的旅游景点推荐模型并在此基础上进行路线推荐。具体研究内容如下:首先,针对现有景点推荐模型建模时信息源考虑不足,以及对游客、景点与各种信息源间复杂交互无法精准建模的问题,
学位
终端设备的爆炸性增长以及用户对服务质量要求的增加促进了边缘计算以及云边端协同的流式服务加载模型的出现。然而,不可靠的分布式场景和跨节点的服务迁移使得流式服务加载的安全性和可靠性受到威胁。缺乏有效的身份验证机制和不可否认机制意味着无法保证互不信任的终端设备和边缘节点之间的信任传递,进而阻碍流式服务加载的进一步发展。区块链作为一种分布式网络数据管理技术,利用密码学与分布式共识协议保证全网一致、不易篡改
学位
[目的]探究城市碳承载力基底,为城市“双碳”目标实现和低碳发展提供科学支撑。[方法]基于2000,2005,2010,2015,2020年四川省宜宾市土地利用数据,通过InVEST模型测度了宜宾市生境质量和碳储存量,构建了宜宾市碳承载力评价指标体系,对宜宾市的碳承载力水平进行深度地分析研究。[结果]宜宾市碳承载力呈现“先提升,后下降,再提升”的变化特征,2000,2005,2010,2015,20
期刊
染色是整个纺织品生产链中的重要环节,直接影响织物的染色牢度、色泽和商品质量。而染色工艺涉及染液浓度、温度、染色时间、PH值等诸多因素。其中,最关键的因素是拼染过程中多组分的染液浓度检测。但传统的混合染液浓度检测方法对仪器要求较高,操作繁琐,导致染液浓度检测准确率偏低,并且不能实现实时在线检测。所以,纺织行业迫切寻求新的浓度检测方法,实现混合染液浓度方便快捷准确的检测。本文分析了RGB检测方法的优势
学位
大脑的神经活动强烈依赖于脑血管网络,神经元活动所需要的氧气和营养物质以及代谢产生的废弃物都需要由血液通过脑血管进行运输。全脑三维显微成像方法,能够对哺乳动物全脑血管进行高分辨率成像,获取毛细血管分辨率水平的脑血管网络图像。血管分叉点是脑血管网络中的关键节点,准确的从三维图像中检测并提取血管的分叉点位置,对于重建脑血管网络和理解脑功能疾病的发病机理具有重要作用。传统分叉点检测方法无法摆脱对人工的依赖
学位