一个改进的蚁群聚类优化算法及其仿真实验研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jiaozhixuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
群体智能以分布性、简单性、灵活性和鲁棒性得到了越来越广泛的关注。蚁群聚类算法是数据挖掘算法的一种,它起源于科学家对群体性昆虫的观察和研究。Lumer和Faieta将Deneubourg提出的基本模型成功地推广应用到聚类分析。LF算法仍然存在一些局限性,它的算法机制无法将偶然堆叠在一起的簇分开,造成了聚类结果往往纯度不高,严重影响了查准率。为了克服LF算法的缺点,通过结合模糊聚类算法,提出了一种改进的蚁群聚类算法。该算法回溯到Deneubourg的基本模型,通过引入相似因子、相异因子的概念,改变观察分数f的计算方法,进而达到影响拾起放下概率的目的。相似因子大小由邻域内选定对象所属的等价分类的大小决定,相异因子大小由邻域内与不包含该对象的一个最大的等价分类的大小决定。在这种方法下,蚂蚁具备从感官上初步划分存在于邻域内的数据对象的能力,以此作为进行下一步决策的依据。在这种方法下,即便在邻域内,形成了两个不同的聚类核,随着聚集速度的不平衡,其中一个略有优势的聚类核会排斥掉另一个聚类核,从而避免了不同簇堆叠的情况。设计出一个基于蚁群聚类算法的数据挖掘系统,该系统具备预处理、变换、数据开采的功能。该系统能够展示可视化的聚类过程。在数据经过预处理、变换之后,得到了规一化的三维属性数据,软件显示界面上的数据对象通过颜色值来标定其三维属性,使聚类过程和效果一目了然。根据该系统的仿真实验,在查准率、查全率和F-measure评估标准下,改进算法比LF算法显示出更好的聚类质量。
其他文献
随着微处理器技术、互联网技术与通信技术的飞速发展,微型化和专业化成为发展的趋势,嵌入式产品逐渐成为信息产业的主流。同时数字视频技术应用广泛,要求其更加灵活地适应现
随着社会信息化的普及,信息作为一种无形的资源对人们生活的影响越来越大,信息安全已经成为社会关注的焦点。网络带宽和速度的迅猛增长,使得信息安全领域的工作变得更加困难,
研究了随机可靠性试验数据的处理方法与软件。完成了3项任务: 第一,根据可靠性寿命截尾试验原理,用待测随机变量代替时间参量,拓展可靠性寿命截尾试验的组织方法与数据处理方
随着现代计算机技术的普及和发展,计算机的使用越来越深入到人们的日常生活中。人类与计算机进行交流时,最直接和方便的方式就是语言交流,所以语音识别和语音合成技术已成了
为了解决由于分布和异构带来的“孤岛”问题,OMG组织提出了公共对象请求代理体系结构(CORBA),以增强软件系统间的互操作能力,实现企业内各信息系统的有效集成。随着Internet
随着Internet的发展,网络丰富的信息资源给用户带来了极大的方便,但同时也给上网用户带来了安全问题。目前,网络的攻击手段越来越多,入侵手段也不断更新。由于网络的攻击造成
近年来,分布式数据库的应用变得更加广泛,但分布式数据库中的多连接查询优化问题却没有得到很好的解决。随着分布式数据库的规模不断增大,多连接查询优化问题越来越深地影响着数
近年来,会话初始化协议(session initiation protocol,简称SIP)在通信和网络研究领域受到极大关注,是下一代网络(NGN)中的核心协议之一。SIP是工作在应用层上的一个信令协议,可以
RFID技术是一种无需接触的自动识别技术,因其技术特点和良好的应用前景,自上世纪90年代出现以来发展迅猛,已在物流、制造业中广泛应用。与传统的条形码需要进行手动不同,RFID标签
近年来,数据挖掘引起了信息产业界的极大关注,主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以用于多种领域,包