论文部分内容阅读
聚类分析作为一个重要的工具已经广泛应用于多个领域(?)模糊聚类算法由于具有良好的聚类性能与数据表达能力,已经成为近年来研究的热点.本文对当前主要的模糊聚类算法进行了研究,针对这些算法中存在的不完善之处提出了相应的改进算法,并对一类基于核的模糊聚类算法的收敛性给出了理论上的证明.本文所作的工作归纳起来主要有以下几点:一、深入研究了FCM类算法,提出了一种新的基于核的模糊聚类模型(IKFCM聚类模型),并得到三种不同形式的IKFCM聚类算法-IKFCM1、IKFCM2和IKDFCM算法.IKFCM1、IKFCM2算法通过核函数将数据映射到高维的特征空间,提高了算法发现非线性可分形状聚类结构的能力.IKDFCM算法利用核化距离作为聚类的相异性测度,对噪声与野值点有着更好的鲁棒性,计算的时间空间复杂度相对较低.二、证明了IKFCM算法与基于核的FCM算法(KFCM)的收敛性,这是对原有非核聚类算法收敛性定理的一种推广.收敛性定理表明特征空间内的此类模糊聚类算法的收敛性与数据核矩阵的秩之间有着密切的关系,核化距离形式算法的收敛性与核函数的凸性之间存在着密切的关系.三、提出了带有凸包约束的(核)可能性聚类模型,并引入全局优化技术对提出的模型进行求解,较好的解决了原始算法容易陷入局部极值与鞍点的问题.提出的算法对解的可行域进行限制,克服了原始算法中易产生重合聚类的不足,并且比普通的基于优化技术的(核)可能性聚类具有更高的效率.四、提出了利用迭代不动点的吸引域进行聚类的想法,并引入了一种新的聚类有效性指标,得到了一种新的均值漂移聚类算法及其快速算法,算法避免了FCM类算法中人为对初始中心作出假设的不足,并实现了对大数据集的聚类.