论文部分内容阅读
K-means算法在无监督学习中有着广泛的应用。然而,K-means算法有两个主要缺点,一是容易陷入局部极小,二是需要用户事先指定参数k。二分K-means算法的提出解决局部极小的问题。利用二分K-means算法过程中每次分裂产生的新质心间距离的变化规律可以对二分K-means算法做进一步的改进,从而将实际类别个数k的确定自动化。