论文部分内容阅读
近年来兴起的数据挖掘技术是一种能够自动处理海量数据资源并将其转化为有意义知识的有利工具。聚类分析作为数据挖掘领域的关键技术,近年来已经逐渐成为业界内的研究热点,是一个富有挑战性的研究课题。它可以按照事物间的相似性用数学的方法研究和处理给定对象的分类,在此过程中并没有教师的指导,是一种无监督的分类方法。本文对现有聚类技术进行了较深入的研究。首先,在分析传统聚类算法的基础上,针对传统算法的不足,基于智能融合互补的观点,将研究重点放在了基于智能融合技术的聚类算法方面,讨论基于计算智能的聚类方法。计算智能的方法具有良好的优化特性和自学习、自适应能力。将其引入到聚类分析中,得到的智能聚类算法不仅可以克服传统算法的缺点,而且具有较高的聚类有效性和可用性。其次,本文通过对现有的几种智能聚类方法的深入分析和讨论,综合其缺点和不足,以数据分析为中心,提出了解决方案,即基于克隆网络的聚类算法。该算法将免疫克隆策略用于网络结构聚类中,结合改进的变异算子和禁忌克隆操作对原始数据进行学习,进化出一个克隆网络来反映原始数据在状态空间中的分布。这种无监督的聚类算法不仅能够有效克服一般方法对初始化敏感、依赖聚类原型、收敛速度慢等缺点,而且与数据分布无关,能够处理海量、多维、属性复杂的网络数据。本文通过仿真实验严格的验证了算法的有效性。同时,探讨了克隆网络聚类算法的应用研究,将其用于网络数据分析,通过异常检测实验验证了算法的可用性和可解释性。