【摘 要】
:
计算机在实际生产中的广泛应用产生了海量数据,从而开启了大数据时代。随之而来的挑战是如何从中找出有价值的、完整的、能够为决策提供依据的知识,这一要求让数据挖掘技术得
论文部分内容阅读
计算机在实际生产中的广泛应用产生了海量数据,从而开启了大数据时代。随之而来的挑战是如何从中找出有价值的、完整的、能够为决策提供依据的知识,这一要求让数据挖掘技术得以快速发展。聚类分析是数据挖掘中的一个重要研究领域,在数据分析、模式识别、图像处理等诸多领域得到广泛的应用。近年来蚁群算法被应用到聚类分析中,蚁群聚类算法具有正反馈和高并行的特点,不过也存在收敛慢、容易停滞,易于陷入局部最优的问题。而遗传算法具备快速良好的全局搜索能力,将两种算法进行融合,充分利用这两个算法各自的优势和特点,能更有效地进行聚类分析。本文的主要工作如下:(1)本文对聚类分析的相关知识进行了介绍,同时分析了蚁群算法及蚁群聚类算法相关知识,在此基础上提出了 GACA算法。(2)在遗传算法和蚁群算法融合处,设计了数据分布新方案,以单一元素和堆的形式分布在二维空格中,另外为了防止蚂蚁搬运数据发生反复震荡现象,算法中使用了蚂蚁记忆标记策略。在遗传算法中设置了最大最小进化代数,通过种群进化率判定算法融合点,并且尝试了以聚类质量估计聚类数的思路。(3)本文选取了 Car、Soybean、Voting、Zoo 四个 UCI 数据集,用 K-modes、ECA、GACA、LF四个算法做了实验,通过实验结果分析可知,本文给出的GACA算法在聚类正确率和收缩率方面更优。
其他文献
本文主要研究具有B-D功能反应项的捕食者-食饵模型的稳定性.第一部分讨论具有B-D功能反应项的捕食者-食饵扩散模型的稳定性,给出常微分系统,弱耦合反应扩散系统和交错扩散系
数字几何处理作为新兴的交叉学科,既继承了传统数学中的很多理论和方法,同时又呈现出该学科别具一格的地方。尤其是数值优化理论与几何方法的相互融合,为数字几何处理中的系
环境镉污染问题越来越严重,特别是由于化肥农药的使用、污水排放等原因,使得土壤中镉污染形势越来越受关注。水稻是我国的主要粮食产物且是易吸收积累镉的大宗农作物之一。由于受土壤及水体中镉污染的影响,使得稻米中镉污染问题仍然严峻。纳米技术在农业生产中的应用越来越广泛,纳米颗粒、纳米粉末等均用于治理有毒重金属。纳米氧化锌对镉的修复也日益受到学者们的关注与研究。本文以水稻两优8106为试验材料,通过营养液培养
随着化石燃料的逐渐减少和油价的逐年上升,越来越多的人开始关注新能源,核能作为一种产值高的新能源当然也不例外。但是,核能利用过程中的安全问题却不容忽视,切尔诺贝利和福
随着互联网的迅速发展,移动智能终端日益普及,其中Android手机最受手机用户青睐。据统计,Android手机已经占据了超过80%的市场销售份额。然而这也吸引了不少恶意的Android开
近年来,社交媒体网站的使用者越来越多,人们也越来越喜欢在网站上分享照片,这些照片可以反映出每个用户自己的兴趣爱好,一般具有相同兴趣爱好的用户所分享的图像都很相似,因
随着个体、企业部署在云数据中心上的业务应用数据快速增长,云数据中心的能耗问题变得日益严重。引起云数据中心能耗的因素有多方面,其中,资源分配方式决定了任务执行模式和物理资源利用状态,对物理机、网络等能耗产生直接影响。低效资源分配方式会造成物理机间负载不均衡,导致部分物理机高负荷运转,而部分却接近空转。利用虚拟机迁移能够有效地降低能耗并实现物理机负载均衡,然而现有的虚拟机迁移研究大部分未考虑虚拟机间之
随着云技术的不断发展,越来越多的企业和个人使用云技术。云技术给人们带来运营成本低、数据管理方便等优点的同时,也带来一系列安全问题。由于用户外包的数据都带有强烈的隐
近年来,符号语言,如LATEX,以及模板编辑器被越来越多的用于向科学文档中输入数学公式,但是,这类输入方式对用户的要求较高,且需要经过专门的训练。随着触屏设备的普及,手写输
随着科学技术的不断发展,多媒体信息的发布和传播变得十分容易,这使得非法分子能轻易的获得数字多媒体信息,因此如何保护多媒体信息的安全性已经成为当下社会急需解决的热点