论文部分内容阅读
为提高文本聚类效果,将影响聚类效果的两大因素聚类数目和初始中心点作为自变量,聚类结果的适应度作为因变量,利用双重遗传算法控制两大自变量,提出TCDGK算法模型。引入经典的k-means聚类算法获得不同初始中心点下的聚类结果,针对内外层遗传算法控制的变量的差异,采用分层编码策略,利用聚类紧密度评价聚类结果的优劣;算法终止后,获得相对最优的聚类数和某聚类数目下的最优初始中心点。仿真结果表明,该算法具有很好的有效性。