论文部分内容阅读
随着社会的进步,计算机网络、通信技术一直在持续高速发展,全球信息化趋势不断加强,无处不在的数字化信息,人类已经感受到了网络对于社会文明发展的推动作用,也认识到网络安全问题是影响一个国家长远利益亟需解决的问题。对于目前网络中大量的、未知的新型攻击,数据挖掘技术有着比较好的应用,从而成为了入侵检测中的热点研究领域之一。 本文基于上述背景,以聚类分析为主线,提高检测率和降低误报率为目标,开展以算法为基础的入侵检测研究,在对算法进行改进的基础上得到一种增强的k-means k-means算法,并进行实验仿真及结果分析。本文主要研究工作如下: 1.对影响k-means算法聚类结果的相关问题进行了讨论,并引入一个阈值参数,提出一个增强的k-means算法,并把它与k-means算法、k-means++算法在检测数据样本中的实施效果进行了对比和分析。 2.由于不同数据类型会影响聚类结果,在进行聚类前,提出了对数据进行标准化思想,提高聚类精度。 3.由于k-means算法在很大程度上依赖初始中心点的选择,而且容易受噪声和孤立点的影响,针对这一缺点提出了一个针对噪声、孤立点的预处理过程,并引入一个阈值,以寻找出较为准确的聚类中心,从而得到更好的划分结果。 4.运用增强的k-means算法到Snort入侵检测系统,设计了一种基于聚类分析算法的入侵检测系统框架,并应用该系统做了大量仿真实验。 本文分别采用随机数据和KDD Cup9910%数据集进行实验仿真及结果分析,理论和实验结果都证明此增强的k-means算法在应用上都要优于k-means算法和k-means++算法。