论文部分内容阅读
聚类算法是数据挖掘算法之一,最常见的聚类算法是K-means聚类算法,但该算法是局部最优算法,只有初始聚类中心选得恰到好处,算法才能达到全局最优。关于K-means聚类算法中初始聚类中心的选择,国内外已有很多改进方法,本文在前人研究的基础上进行研究和探讨,研究工作主要有:(1)提出了一种新的选择初始聚类中心的K-means聚类算法,主要是将k-dist值与最近邻法结合来确定初始聚类中心。经实验验证,发现新算法的聚类效果比传统的K-means聚类算法更好,体现在Sil指数更大,类内数据的距离平方和更小。(2)将新算法应用于股票投资中,研究结果表明改进后的新算法可以将股票更有效地分类。