论文部分内容阅读
随着信息技术的发展,特别是互联网的发展和信息量的爆炸性增长,信息的重要性与日俱增。作为数据挖掘的重要工具之一,聚类技术得到越来越多的关注。随着数据挖掘技术的广泛应用,聚类研究也面临更多新的内容和挑战,聚类稳定性、准确性和有效性是聚类分析领域中被广泛研究的问题。在聚类分析中聚类融合算法是一个新兴的研究方向。本文系统地分析了聚类分析领域的知识,充分地研究了聚类融合算法的基本原理和特性。当前聚类融合算法中大多不考虑进行融合的聚类成员的质量,而当部分成员的质量较差或者有噪声干扰时会影响融合结果,针对这个问题本文提出了基于权重设计的聚类融合算法。主要思想是通过评价聚类成员的质量及分析成员之间的差异度来设计各个成员的权重,进而得到更好的融合结果。该算法提高了质量较好的成员对结果的影响,有效地降低了噪声干扰,提高了聚类的精确度。最后,在分析了当前的入侵检测技术之后,将提出的改进算法应用到入侵检测系统中去。