基于智能算法的聚类算法研究

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:lazysheep85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是分析数据并挖掘潜在信息的一种有效手段.K-means聚类算法是一个基于划分且应用非常广泛的聚类算法,因此以改善运行效率和聚类结果为目的的K-means聚类算法的改进研究具有重要的理论意义和实际应用价值.本文综述了K-means聚类算法的研究背景、意义及研究方法,简介了花粉算法和蝙蝠算法后,重点研究了基于智能算法的K-means聚类算法的改进.1.建立了基于花粉算法的K均值聚类算法.针对原始花粉算法寻优精度低、后期收敛速度慢等问题,加入高斯白噪声扰动改进花粉算法.利用改进后花粉算法强大的全局搜索能力优化K-means算法的初始聚类中心,通过基于距离的方法消弱孤立点对聚类的影响,并对该算法的性能进行了验证和测试,仿真结果表明该算法有效的避免了其陷入局部最优,改善了聚类性能.2.建立了基于蝙蝠算法的K均值聚类算法.为解决传统K-means算法中聚类中心选择不当,导致聚类算法陷入局部极值的问题,通过采用蝙蝠算法搜寻K-means算法的初始聚类中心.将模拟退火的思想和基于排挤的小生境技术引入到蝙蝠算法中,以克服算法存在后期收敛速度慢、搜索力不强等问题,并用测试函数验证了其有效性.然后利用改进后的蝙蝠算法优化K-means算法的初始聚类中心,并将该改进的算法与传统的K-means算法的聚类结果进行了对比,仿真结果表明,改进后的算法的聚类性能比传统的K-means算法有很大提高.3.将改进的K均值聚类算法应用于农业方面.根据山东省和安徽省两省的主要农产品等情况,先选取16个初始指标,利用主成分分析降为4个综合指标,然后对两个省的33个不同地区进行聚类分析,将地区分为两类.聚类的结果为管理者更好的了解农业的发展现状、完善农业结构、提高农业综合效率、加快经济发展提供可靠的依据.最后,对本文内容进行总结,并对此后的研究工作做进一步的展望.
其他文献
有关社区发现的理论研究一贯在社会网络的课题中占有非常的重要地位。而近几年计算机网络技术的发展,使得社会网络的规模由现实生活中人与人之间的关系,逐步扩展到了在线虚拟
大数据研究的兴起,使得数据首次作为一种资源,受到了政府、企业以及学术界等社会实体的高度关注。人们已开始从数据受益,数据中蕴含的重要价值已初见端倪。然而当人们在使用
本文基于新经济地理学理论,采用长江中游城市群城市分行业两位数水平的制造业数据,运用空间统计方法,分析了 2000-2012年长江中游城市群产业聚集的时空特征及变化趋势。基于2
大气边界层是下垫面和自由大气之间动量、热量和水汽等交换的重要桥梁,湍流垂直输送是边界层内的主要过程。研究边界层内的湍流特征尤其是其垂直分布特点是边界层气象研究的
研究背景缺血性心脏病,又名冠状动脉粥样硬化性心脏病,是当今世界死亡人数最多的疾病,严重危害人类健康。当冠脉粥样硬化斑块破裂时,可引起血小板激活,进而形成血栓,导致一系
随着家居用品电商化的发展和垂直导购平台的兴起,需要从技术上提升家居用品垂直电商化导购的用户体验。目前电商行业也面临着信息爆炸的问题,据统计淘宝上的商品种类已经细化
随着互联网的普及与发展,人们在各种网络平台上获取、生产信息。各大网络平台中随之积累了大量的Web短文本数据,这些Web短文本中蕴藏着丰富的信息,如何从中挖掘信息具有重要
“十三五”时期是改革开放的关键期,全面建成小康社会的决胜期。“以人为本”成为全面发展的第一导向,实现最广大人民的根本利益成为全面建成小康社会的出发点和落脚点,民生
生产系统平稳有效地运行有利于提高产品质量、保护人身财产安全,这在生产过程中至关重要,过程监视技术是其中的关键。批次生产过程在现代工业中占有很重要的地位,其安全问题
植物受到环境胁迫时,可以迅速合成并积累不同种类的渗透调节物质来维持植物细胞内正常的生理机能,避免植物受到胁迫伤害,棉子糖系列寡糖(RFOs)即为一种小分子渗透调节物质。