论文部分内容阅读
本文从信息论的角度考虑了聚类问题,将聚类看成是有损信息压缩的过程。首先运用率失真理论建立了模糊聚类的优化模型,与经典的模糊聚类模型相比,模型的目标函数中多了一个描述聚类过程复杂度的指标。同时为了估计聚类数目,还提出了一个新的聚类有效性指标。其次通过求解优化模型得到基于率失真理论的模糊聚类算法。最后将基于率失真理论的模糊聚类算法与经典模糊C均值算法进行了数值实验比较。数值实验结果表明基于率失真理论的模糊聚类算法能够自动确定聚类数目,在运行时间上比模糊C均值算法有一定减少,且最终的模糊划分矩阵与模糊C均值算法