无监督相似流形学习算法研究

来源 :苏州大学 | 被引量 : 1次 | 上传用户:cassyqc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流形学习假设高维数据存在嵌入到高维空间中的低维(本征维度)流形,因而可对数据进行降维处理,揭示其内在性质。在本征维度下,更易研究高维数据的性质。研究发现,本征维度的估计影响着流形学习方法的效率。针对这一问题,本文提出了无监督相似流形学习算法。本文的主要工作如下:(1)提出了基于无监督图嵌入投票集成的相似流形学习算法。该算法在无监督大规模图嵌入的基础上,获得高维数据的多个相似低维流形嵌入,并采用K-means方法对这些低维嵌入进行聚类。随后采用简单投票原则对多个子聚类进行融合,得到最终聚类结果。在5个图像数据集上的实验体现了该算法的高效性。(2)提出了基于聚类集成的相似流形学习算法。该算法对基于无监督图嵌入投票集成的相似流形学习算法进行改进,使用K-means生成更具有代表性的锚点。我们发现从相似度矩阵的特征向量中可直接得到低维流形嵌入。在此基础上,获得多个相似低维流形,并采用简单投票原则得到最终聚类结果。实验表明基于聚类集成的相似流形学习算法有明显的优越性。(3)提出了基于选择聚类集成的相似流形学习算法。在基于聚类集成的相似流形学习算法的基础上,该算法首先通过改进的层次平衡K-means方法生成锚点并计算相似度矩阵。其次计算得到原始数据在不同维度下的相似低维流形嵌入。对于低维嵌入的聚类结果,计算归一化互信息作为权重来衡量子聚类的重要性。最后,舍弃权重较低的子聚类并采用基于权重的选择性投票方案来获得最终聚类结果。该算法避免了对本征维度的估计并优于其他对比算法。大量实验体现了该算法的性能。综上所述,相似流形学习通过对多个低维相似流形的研究来探究高维数据的内在性质。通过集成学习对多个相似低维流形嵌入进行融合,相似流形学习方法不仅避免了对高维数据本征维度的估计,同时也提升了无监督学习的性能。
其他文献
众所周知,市场的活力来自于人,企业的发展需要优质的人才作为支撑,而外贸企业的行业特殊性,决定了国际化人才必将成为其争相掠夺的人力资本。企业之间为了在国际舞台上抢得一席之地而不断加剧的竞争态势,加上新的时代背景下市场化就业机制带来大众对于离职跳槽观念上的转变,外贸企业国际化人才流失的情况愈演愈烈、日趋严重,为企业的忠诚度管理带来巨大挑战。正因如此,探索外贸企业如何不断加强国际化人才忠诚度管理的问题有
农业 农民增产又增收$$  本报记者 郑德刚$$  春节前夕,记者重走四川汶川地震灾区。“我家种的甜樱桃去年卖了4600多元。”在汶川县克枯乡周达村,果农张光慧指着家里新添
报纸
目的:探讨清燥救肺汤加减辅助化疗对非小细胞肺癌(NSCLC)生活质量和生存期的影响及对免疫功能和细胞因子的调节作用。方法:将120例患者随机分为对照组和观察组各60例。对照组采用
在江淮方言洪巢片中,“要打/要死+语气词”已语法化为一个具有叹词特征和功能的习语,表示对突然出现的不期望发生的事情的感叹。“要打/要死+语气词”在语法化中经历了句法位置的
硒是人体必需的微量元素,且有利于植物生长发育及提高品质。但目前对硒施用于植物的研究主要集中于粮食及经济作物,对药用植物,尤其对三七鲜有报道。三七是第一批通过国家GAP
隧道结构可靠度评价一直是隧道工程领域的一项重要课题,目前概率可靠性理论及相应的概率极限状态设计法已经得到了一定的推广,但作为其补充和发展的非概率可靠性评价法在隧道
<正>苏教版九语(下)《江城子·密州出猎》被人们公认为是苏轼的第一首有代表性的豪放词。这首词借行猎表达了作者渴望建功立业、报效朝廷的豪情壮志。作者当时不过四十岁,正
东晋末年,北府兵将领刘裕乘势而起,建立刘宋政权。经过宋武帝、宋文帝两代人的努力,皇权得到加强,生产发展,吏治清明,出现了天下大治的盛世局面,史称“元嘉之治”。但是元嘉
随着我国文化体制的改革和出版社的转企改制,我国的图书市场日益完善、竞争也日趋激烈。激烈的图书市场竞争促使出版企业必须不断改革和创新经营管理,努力适应不断变化着的图
为了培养高等院校药学专业学生的动手能力、创新能力,及学习的主动性和积极性,提高药剂学实验的教学效果,结合CDIO的教学理念,改革现有的药剂学实验教学内容、优化教学方法及