论文部分内容阅读
聚类分析在科研和商业应用中都有着非常重要的应用,K-means算法是聚类方法中常用的一种划分方法。随着数据量的增加,K-means算法的局限性日益突出。在百度地图的各种坐标体系下,提出一种改进的基于网格的K-means算法,用新的方法确定k值以及K个初始质心。相对于传统的K-means算法,该算法在一定程度上减少了因采用误差平方和准则函数而出现较大的聚类簇分割开的情况,仿真实验结果表明:改进后的K-means算法优于原始算法,并且稳定性更好。