基于GA优化的核模糊C均值聚类算法的研究

被引量 : 0次 | 上传用户:tobydu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据资源的爆炸式增长,数据挖掘已成为人们获取有用信息的不可缺少的数据分析方法。无监督的模糊聚类分析作为数据挖掘的一种有效工具,已经很好地应用于信息检索、模式识别、数据分析、图像处理等各个领域。本文以模糊聚类算法的优化和应用为研究内容。在所有的模糊聚类算法中,基于目标函数的模糊C均值(Fuzzy C-means, FCM)聚类算法因其局部搜索能力强且收敛速度快的特点而被广泛应用。但是,该算法主要存在两个缺陷:第一,隶属度和为1的概率约束条件易造成它对噪声和孤立点敏感;第二,它本质上是一种局部爬山算法,这使得它对初始聚类中心敏感且容易陷入局部极值。针对FCM聚类算法存在的问题,本文通过结合改进的遗传算法(Genetic algorithm,GA)与核技术对FCM聚类算法进行优化处理,提出一种基于GA优化的核FCM聚类算法(GA-KFCM)。首先,设计一种改进的自适应遗传算法。该算法基于实数编码方式,采用非线性排序选择方法,自适应交叉、变异策略,以及最大进化代数准则和种群平均适应度收敛准则等。然后,采用一种基于核的FCM聚类算法(KFCM)。利用核函数改变FCM聚类算法中的距离函数来定义目标函数,从而改进FCM算法的概率型约束条件。最后,将本文设计的改进的自适应遗传算法与KFCM聚类算法相结合,提出了一种GA-KFCM算法。该算法利用外层改进的自适应GA优化初始聚类中心,然后,采用KFCM算法指导分类,从而改善FCM算法的聚类性能。本文通过Matlab进行实验和仿真,使用IRIS和WINE数据集测试FCM算法、KFCM算法以及GA-KFCM算法的性能。实验结果表明,本文所提出的GA-KFCM算法有效地克服了FCM算法的缺陷,极大地提高了聚类性能。在此基础上,将GA-KFCM聚类算法用于文本分类,应用效果验证了本算法的有效性。
其他文献
近年科技项目后评估开始受到关注和研究,取得了许多理论研究成果,不少地方也进行了探索性的开展。广州现行科技项目管理制度中,绩效评价工作开展较少,科技项目评估评审工作多
本文针对荞麦在收获后到食用时品质下降过快的问题,选用了内蒙古地区东、西部几种具有代表性的荞麦样品,在理论分析的基础上,通过真空袋装和试剂护绿处理的贮藏试验,对荞麦米
科技经费的分类  韩国的科技预算可以分为三大类,即研究开发预算、科技振兴预算和科学技术行政预算。  1.研究开发预算。约占科技预算的3/4,是中央行政机构直接支持研究开
"5+3"的医学人才培养体系是我国参照国际主流医师教育培训模式、行业惯例和中国国情基础上的重大制度创新。结合儿童保健专业特点,本教研室临床教学团队对儿童保健"5+3"住院
雷达穿墙检测是一种新颖的生命探测技术,可应用于地震后废墟中人员搜寻以及反恐行动中人质的营救等场合。对雷达信号穿墙后的衰减和波长选择进行了归纳总结,对穿墙雷达回波信号
目的:建立白术的指纹图谱,为白术药材的质量控制提供依据。方法:采用RP—HPLC法建立白术商品药材及饮片的指纹图谱。色谱柱为Synergi Fursion—RP(250mm×4.6mam,4μm);流动相为
本文研究了沙棘材的宏观、微观、超微构造及部分物理力学性能,测定了沙棘材的纤维形态,讨论分析了沙棘枝条大气干燥过程中的水分迁移规律,并与其他沙生灌木及常用针、阔叶材的构
<正> 一、试验方法 我们先后两次用不同比例晒干粉碎的本地银合欢(灌木型)叶粉代替日粮中等量的精饲料喂生长肥育猪。试前阉割、驱虫、防疫注射,用试验料预饲三天,然后转入正
文中结合唐山港集团档案管理工作实际,从提高档案利用水平的角度介绍了企业档案信息化建设情况,描述了港口档案开发利用的几个典型案例,提出了企业档案开发利用的努力方向,旨
随着地方科技投入持续快速增长,科技投入的绩效越来越受到重视,但我国对科技投入绩效评价还处于探索实践阶段,项目后评估更是近几年才开始受到关注和研究。在学习、借鉴国内