基于超图划分的高维数据聚类方法研究

来源 :兰州大学 | 被引量 : 1次 | 上传用户:lcg512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一个相当重要的课题,随着现代技术的发展,数据结构变得复杂,使得数据的维度相应增大,数据维度的增长,对传统的聚类算法带来了不同的挑战,特别是,对于高维数据,由于维灾难的影响,传统聚类算法使用的相似性度量在高维空间中是没有意义的,高维数据存在的普遍性,使得高维数据聚类的算法研究已成为聚类分析的一个重要研究方向,很多针对高维数据的聚类方法被提出来。其中,基于降维的聚类方法是处理高维聚类的一个行之有效的手段,通过将高维数据降低到相对较低的维度,在减少数据维度的过程中,又很好的保留了数据的结构特征,然后再使用传统聚类算法对其进行聚类。数据降维的技术近些年得到了快速的发展,典型的降维算法有PCA,LLE,SNE,Autoencoder等,不同的方法适合于不同的数据结构。同时,由于高维数据的很多属性都是冗余的,只有少量的主要特征决定数据的结构,这启发了子空间聚类的产生,子空间聚类就是找到嵌入在原始数据空间的特征子空间,并在这些子空间考察聚类的过程。超图划分被认为是处理高维数据聚类的有效方法。在本文的研究中,提出了一个新的高维聚类方法称为MDSG(Merging Dense SubGraphs)。该方法首先通过共享近邻(SNN)方法,构造数据的共享近邻图G,然后将图G中的最大团定义为超图的超边,构造出一个超图。最后利用一个改进的超图划分方法得出最终聚类结果。使用几种不同类型的高维数据集对本文提出的MDSG方法进行评估,实验结果表明,在高维数据的聚类方面,该方法优于传统的聚类方法和其他超图划分方法。
其他文献
摘 要:高职教学应该以培养学生的职业素养为目的,帮助学生进行更加有效的学习,而不是为学习而学习,使语文课程的学习能够对学生的工作有所帮助。本文主要针对当前高职语文教学中存在的问题,探讨基于职业素养培养的高职语文教学研究。  关键词:职业素养;高职语文;教学研究  一、当前高职语文教学中的问题  高职教学的主要目的是为社会培养高素质、高技能的专业性人才,在日常的教学中更趋向于培养学生的专业技能,高职
关于房地产价格问题,最近又重新成为社会各界关注的热点。对于房价是涨是跌,各方分歧很大,除了判断上的差异外,2006年一季度以来不同的价格信息来源也是导致对房地产价格产生分歧
摘 要:在高职语文教学中,写作教学有着很强的实用性。但是,当前高职院校语文写作教学受重视程度不足,课程设置不合理、教学内容与方式过于单一、写作实践流于形式。面对这些问题,采取开放的多样化教学方式是一种积极的教学改革思路。  关键词:高职院校;语文教学;写作教学;开放式教学  当前社会,读写在实际工作中有很强的实用性。但是,大学语文教学在工科院校,尤其是高等职业院校中却逐渐被边缘化,这导致了很大一部
浩口水电站厂房结构柱采用清水混凝土浇筑,室外墙体采用C15预制混凝土砖砌筑,室内墙体采用轻质隔墙施工,施工完成后均达到免装修的效果,免装修技术的应用不仅在外观质量和工
电气设备作为保障发电厂安全且可靠运行的关键与基础,需要保障其长时间安全稳定运行.随着科技的不断进步和发展,电气设备的更新周期越来越短,对电气设备相关技术人员和管理人
摘 要:在医学生物化学教学中,传统以教师为主导的教学模式已经不能适应于综合型人才的培养。尝试PBL与TBL相结合的教学方法后,由于各小组中成员相互合作,学习积极性高,参与性强,能使学生能更好地发现问题、分析问题、解决问题,达到自主学习的目的。  关键词:TBL教学法;PBL教学法;医学  生物化学是一门理论抽象、概念繁多的学科。笔者在5年的本科教学过程中发现,大多数学生反映该门课程学习的难度大,对
随着网络信息时代的到来,5G技术的推广运用使互联网迅速进入视频时代,每个人都成为这个时代信息的生产者和传播者。短视频作为新型媒介载体,在社交、娱乐、表达自我和个性展
所谓实名制购房,主要是要求预售购房合同、预售登记以及最后的产权证必须是同一个姓名,这一规定的主要目的是遏制房屋预售阶段的内部认购、囤积房源、哄抬房价等炒房行为,以及防