基于线性判别分析(FDA)的迁移学习方法

来源 :广东工业大学 | 被引量 : 4次 | 上传用户:ZXX198811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
线性判别分析分类问题是一个在学习样本不充分下的一个有监督学习问题。单单是从在实现的角度上讲,我们在理论上可以这么认为,这一个问题是利用一个非线性映射函数,这个映射函数是可以把我们在维度很高的空间中的数据样本通过这个函数映射到一个维度很低的特征空间中。通俗的说,我们是可以这么看待线性判别分析分类这个问题的,它就是从维度很低的特征空间中提取数据样本的特征,并且对特征进行分类,并将其与不同类别的数据样本分离开来。线性判别分析学习在特征提取,分类和聚类有很广泛的应用。在本文中,我们提出了一种名为线性判别分析的迁移学习方法的新方法,这种方法可以将从源域任务中学习到的知识和信息从源任务迁移到目标任务,并为目标任务建立FDA模型,帮助目标域任务的数据样本分类。通过一个非线性映射函数的方法的优点是它们可以在非线性数据情况下解决FDA数据维度不同、数据样本分布不同以及结构不同的问题。我们考虑的函数映射确定投影方向,并使用此投影方向将数据集映射到数据在特征空间中最分离的超平面。我们提出方法分两步进行。在第一步中,我们将源域和目标域的数据样本作为一个整体,然后将源域数据和目标任务分别通过映射函数放入特征空间。然后,我们为目标任务构建基于迁移学习的FDA模型。在第二步中,我们优化提出的迁移学习模型以获得最优投影平面,让目标域的数据样本分离开来。本文的主要贡献可归纳如下:1.我们利用一个非线性函数,这个映射函数是可以把我们的源域数据样本投影到一个维度相对较低的空间中。利用FDA的自有判别标准下获得一个最佳投影方向。此外,我们构建了基于迁移学习的线性判别的基础模型。2.在映射空间中,我们计算了数据样本的类内和类间的平均值和离散度,以获得源域的最佳投影方向。通过计算,我们找到了源域和目标域的最佳投影方向。最后,我们通过引入拉格朗日乘数的方法来计算目标域的最佳投影方向。3.我们进行了广泛的实验来研究我们提出的TL-FDA方法的性能。我们在20Newsgroups,Reuters-21578和Cora这三个数据集上进行了实验,并且利用了机器学习上很普遍的三种有效的分类方法对上面的结果进行比对。第一种是决策树分类方法,第二种是支持向量机的分类方法,最后一种则是神经网络。把本文提出的方法与核主成分分析(KPCA),局部线性嵌入(LLE),等距特征映射(ISOMAP)以及核线性判别分析(KLDA)作了一个比较,结果表明TL-FDA比经典特征提取方法表现更好。
其他文献
在目前高校的互动中,辅导员工作及其相应的地位已经越来越受到重视,各个高校纷纷出台相关方面的一些措施加强辅导员队伍方面的建设,建立了相应的辅导员工作评价方面的一些制度,但
女性主义翻译理论是翻译研究的最新进展与女性主义运动相结合的产物。本文探讨了女性主义翻译理论产生的背景、翻译观、翻译策略以及它对翻译研究的影响和贡献,最后指出其自
2006年底,上海、宁波-舟山、秦皇岛、大连、深圳、广州、天津、青岛、苏州、南京、日照、南通、烟台共13个港口年货物吞吐量超过亿吨,中国港口的崛起令世人瞩目,港口强国概念
随着摄影门槛的不断降低,越来越多的人选择在业余时间拿起相机。在杭州人的生活里,手机摄影变成了不可或缺的记录生活的方式,无论是热爱广场舞的大妈还是追求时尚的年轻人,都喜欢
随着我国房地产市场的建立,我国的房地产出现了前所未有的变化,其显著特点之一,就是住宅商品化的广度和深度正在不断地发展。尤其是近几年,随着一系列房改政策的出台,房地产
在国家经济不断发展的今天,人类已经步入了信息化时代。作为我国经济发展的重要产业——建筑业,也在努力运用各种新鲜的科学技术进行尝试和突破。更加先进的建筑施工手段也在
经济全球化背景下,知识扩散速度加快、产品生命周期缩短,知识能力与创新能力逐渐成为企业保持核心竞争力的关键。知识经济时代所表现出的知识泛在性和分散性、商业模式的多元
分初盛中晚唐四个阶段,选取《全唐诗》中与端午或竞渡有关的诗歌进行重点分析,得出五点与前人不尽相同的结论:武则天时期的鹢舟竞渡可以视为今日凤舟竞渡活动的前身之一,唐朝
2017年以来,欧元区及欧盟经济保持较为强劲并具有普遍性的复苏,PMI位于荣枯线上并波动上升,失业率稳步下降并屡创新低,对外贸易稳定地同比增长,通胀水平提高但尚未达到预期。
目的探索新时期下社区护士培训的方法及管理模式。方法通过建立社区护士培训体系、精选培训内容、优化培训方式,提高社区护士培训的效果。结果社区护士培训质量得到提高。93.6%