论文部分内容阅读
随着科技不断的进步,每时每刻高速增长.的新鲜知识与事物充斥着我们这个时代的更迭。我们早已不满足于对数据表面的关注,更重要的是解读这大量数据背后的意义,最终应用数据到更需要的方向中去。数据挖掘的诞生给我们混沌的数据世界打开了一扇明窗,聚类分析作为其主体,自然成为学者们的重点研究对象。另一方面,我们生活的世界是丰富多彩的,各色神奇的物种共同组成了一个完美、和谐的整体,众多的生物群体引发了人们极大的兴趣,其中,蚁群作为其中的佼佼者,被学者们广泛关注研究,蚁群算法具有较强的鲁棒性,采用正反馈机制,可以解决很多复杂优化问题,蚁群算法的研究具有巨大的发展潜力,应用领域及其广泛,典型问题有:旅行商问题、指派问题、调度问题、车辆路径问题、网络路由、图形着色问题、序列排序问题、多背包问题、数据挖掘、图像处理、故障识别等。同时,聚类分析的发展也一直沿着多样化的方向进行,它能够与其他技术相融合,形成新的高效的算法,与群体智能技术的融合就是成功的例子。通过与蚁群算法、遗传算法、微粒群算法等技术的融合,使得聚类的过程更加迅速,聚类结果更优异。这二者结合,产生的新型蚁群聚类算法更以其优良的性能带给人们无限的惊喜。本文以此作为研究方向,具体内容如下:首先介绍了群体智能的概念相关原理,由此引入基本蚁群算法原理,模型,在对各种蚁群优化算法进行简单概述之后,提出了一种改进的蚁群优化算法——基于奖罚机制的蚁群优化算法(RPACO),此算法提出一种奖励与惩罚策略用于信息素更新,另外还设置了信息素的上下限。通过实验对比,证明此算法性能确实有提高,实验结果也更加优良。接着对数据挖掘的定义、对象、知识模式和应用领域作了简单介绍,然后是聚类分析相关知识,包括概述、聚类分析的基本要求、数据类型和相似度计算,并列举了常用的几种聚类分析算法。接下来针对蚁群聚类算法进行研究,蚁群聚类模型有多种,但最基本的蚁群聚类模型为BM模型,在此模型基础上的LF算法被视为经典算法。本文从相似度函数、概率转换函数、增加蚂蚁记忆功能等方面进行改进,并针对原BM模型中有负载的蚂蚁有可能无法成功放置物体导致资源浪费,算法停滞的问题,采取强行放置策略。除此之外,使用K-均值算法作为蚁群聚类的第二阶段,对上一阶段的聚类结果进行优化,使得聚类更为精准。实验测试中,比较了K-均值算法、基本LF算法和此种改进的LF算法,实验证明此改进的算法结果最优。最后,本文还将改进的蚁群聚类算法成功应用到信用卡申请客户分类中去,并且效果良好。