论文部分内容阅读
聚类是分析数据并挖掘潜在信息的一种有效手段.K-means聚类算法是一个基于划分且应用非常广泛的聚类算法,因此以改善运行效率和聚类结果为目的的K-means聚类算法的改进研究具有重要的理论意义和实际应用价值.本文综述了K-means聚类算法的研究背景、意义及研究方法,简介了花粉算法和蝙蝠算法后,重点研究了基于智能算法的K-means聚类算法的改进.1.建立了基于花粉算法的K均值聚类算法.针对原始花粉算法寻优精度低、后期收敛速度慢等问题,加入高斯白噪声扰动改进花粉算法.利用改进后花粉算法强大的全局搜索能力优化K-means算法的初始聚类中心,通过基于距离的方法消弱孤立点对聚类的影响,并对该算法的性能进行了验证和测试,仿真结果表明该算法有效的避免了其陷入局部最优,改善了聚类性能.2.建立了基于蝙蝠算法的K均值聚类算法.为解决传统K-means算法中聚类中心选择不当,导致聚类算法陷入局部极值的问题,通过采用蝙蝠算法搜寻K-means算法的初始聚类中心.将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中,以克服算法存在后期收敛速度慢、搜索力不强等问题,并用测试函数验证了其有效性.然后利用改进后的蝙蝠算法优化K-means算法的初始聚类中心,并将该改进的算法与传统的K-means算法的聚类结果进行了对比,仿真结果表明,改进后的算法的聚类性能比传统的K-means算法有很大提高.3.将改进的K均值聚类算法应用于农业方面.根据山东省和安徽省两省的主要农产品等情况,先选取16个初始指标,利用主成分分析降为4个综合指标,然后对两个省的33个不同地区进行聚类分析,将地区分为两类.聚类的结果为管理者更好的了解农业的发展现状、完善农业结构、提高农业综合效率、加快经济发展提供可靠的依据.最后,对本文内容进行总结,并对此后的研究工作做进一步的展望.