论文部分内容阅读
模糊聚类算法是一种非监督的聚类算法,比如典型的FCM、PCM聚类算法,在生活中有广泛的应用,然而基本的模糊聚类算法有各自的缺点,如FCM对噪声点敏感,PCM容易将类中心重合等,鉴于此可以提出混合聚类算法,该算法在保留它们单个算法优点的同时又避免了它们的缺点,在实验中得到了较为理想的效果。由于现实数据的复杂性,对于很多高维的数据以及异构数据集,混合聚类算法又显示出了它的不足,基于上述原因,本文引入Mercer核,提出了基于核的混合模型聚类算法,并通过实验仿真,证实了这些算法的有效性。 本文具体的内容安排可分为以下3点: 1、鉴于人们对于核理论的初步研究,本文在第一和第二章简单介绍了核方法的研究背景及其原理,对聚类分析的理论基础和方法进行了归纳和总结。并给出了KPCM1和KPCM2两种基本的核聚类算法。 2、FCM和PCM的混合模型可以克服它们单独聚类时的缺点,在聚类效果上有很大改进,但是对于特征不明显的样本而言,这种混合模型的聚类效果并不太好,为了克服这一缺点,本文在第三章引入Mercer核,提出了一种新的基于核的混合c-均值聚类模型(KIPCM),运用核函数使得在原始空间不可分的数据点在核空间变得可分。通过数值实验,得到了较为合理的中心值以及较高的正确分类率,证实了本文算法的可行性和有效性。 3、针对多数据源或异构数据集,单个核函数在处理数据上有各自的优点,然而也有各自的缺点。比如,输入空间是两个向量组成的空间,第一个向量服从多项式分布,而第二个向量服从高斯分布,对于这种情况,如果单单采用一种核函数聚类就会显得不足,因此可以将它们组合起来形成多核函数进行聚类分析。本文第四章探讨了将多个单核形成多核函数的一些组合方法,并将多核函数引入聚类中,期望得到较好的聚类效果。