基于核心集粗化的多层次聚类算法

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:xacxd1964
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种无监督的学习方式,是海量数据分析的重要工具之一。对于同一数据集,使用不同的聚类算法产生的聚类结果也不同。至今,众研究学者提出了各种各样的聚类算法。基于多层次框架的聚类算法是近年来出现的一类备受关注的聚类算法,能聚类大规模且任意形状的数据,经典的算法有METIS,Graclus,FAP等。多层次聚类算法的步骤一般分为粗化、划分、细化三部分,其中粗化过程旨在逐层寻找每层数据集的代表点,以获得易于划分的小规模数据集,显然是多层次聚类框架的关键步骤。在METIS、Graclus等方法中,利用顶点和边的权重的某些准则合并顶点和边,来实现粗化,其缺点是粗化之后的小规模数据集无法准确表述原数据集的全局信息和结构。为此,本文通过定义“多层核心集”,提出一种基于多层核心集的粗化算法,并建立了相应的多层次聚类算法(Multilevel Core-sets Coarsening based ClusteringAlgorithm)。基于多层核心集的粗化可以逐层保留数据集的全局信息,其最顶层核心点的个数与聚类个数相同,每个核心点对应了一个单独的类,因此不需要经典多层次聚类框架中的划分过程,即可通过细化算法映射到原数据集,完成整个聚类过程。实验结果表明了本文提出算法的有效性。
其他文献
对于给定的负阶化李超代数K,该文定义了K型的泛阶化李超代数并证明了它的存在性.通过给K添加条件,又定义并讨论其它类型的泛阶化李超代数,进而,由泛阶化李超代数的定义自然地
该文首先在L-凸空间的非空子集上引进新的广义LKKM映射和广义S-LKKM映射.然后,在非紧的条件下建立广义LKKM定理和广义S-LKKM定理.作为应用,我们得到了新的极大极小不等式、鞍
该文第一章介绍了一些必要的概念与记号,问题的背景及该文主要结果;第二章给出了一些辅助引理及定理;第三章给出主要结果的证明.
该文讨论了二阶双曲方程和线性抛物型积分微分方程方程初边值问题的混合有限元方法,得到了这两类问题混合有限元离散格式的误差估计.
该文针对H上平方可积柱径向函数空间,讨论了与之相类似的问题.在第一章中,我们介绍了与小波变换有关的基本概念与一些常用结论.在第二章中,我们利用Gelfand变换刻画了海森堡
该文首先讨论了一类基于无穷区间的倒向随机微分方程解及其在不确定市场环境下不确定厌恶度量中的应用.其次,讨论了一类离散型倒向随机微分方程的收敛性问题及其解的描述.最
随着科学技术的发展和实际应用范围的扩展,人们研究的对象逐步由描述简单系统优化问题的数学规划模型转向了描述复杂系统优化模型.多层规划与交叉规划理论正是近年来发展起来
嵌入期权作为镶嵌在债券结构中允许发行者或投资者改变债券未来现金流特征的条款,它是具备价值的,并构成债券价值的一部分。本文分别以可转换期权和可提前赎回期权为例,分析了由
该文中,对两类同时带有时变参数不确定性和外部干扰的线性奇异系统,研究了它们的有限时间控制问题.首先,在第二节中,该文将文[2]中关于线性系统有限时间稳定(FTS)和有限时间
该文主要研究的是Mortar元的多重网格方法.第一章中的原问题是求解Poisson方程.文中用P1非协调Mortar元来离散原方程,但在粗网格上使用嵌套的P1协调元来离散,离散方程组用多