论文部分内容阅读
随着计算机网络的迅速发展,互联网已经和人们的学习、工作和生活密不可分,人类社会对网络的依赖达到了前所未有的程度,计算网络安全引起了全社会的广泛关注。入侵检测技术作为一个新的安全辅助机制,能在不影响网络性能的情况下对网络进行监测,为系统提供内部攻击、外部攻击等的保护,然而,传统的入侵检测系统缺乏有效性、适应性和扩展性。针对传统入侵检测系统存在的问题,本文将数据挖掘技术引入到入侵检测系统中,这样就能使得系统自适应地修改特征库,尽可能解决手工编写特征库的问题。本文的主要成果包括以下内容:(1)讨论了入侵检测技术。包括网络入侵的概念、流程和方式,以及入侵检测的概念、作用、过程和优缺点,对入侵检测进行了分类,讨论了入侵检测领域的开源产品和商业产品,以及入侵检测的现状和发展趋势。(2)研究了数据挖掘技术。介绍了数据挖掘产生的背景和数据挖掘的概念,讨论了聚类算法、分类算法、关联分析算法和序列分析算法等数据挖掘的主要方法,给出了数据挖掘的发展趋势。(3)重点研究了k-means算法、DBSCAN算法和粒子群优化算法。用DBSCAN算法改进k-means算法得到Density-based K-means算法,用PSO算法改进k-means算法得到PSO-based K-means算法。实验表明,改进的k-means算法较传统的算法,PSO-based K-means算法较Density-based K-means算法的聚类效果好。当然,改进的k-means算法对于属性取值范围很大的数据集有一定的局限性,得到的聚类结果不理想。(4)结合误用检测和异常检测两种检测方式,研究并提出了一种混合入侵检测系统模型及其体系结构。系统分为网络数据采集模块、数据预处理模块、误用检测模块、异常检测模块、响应模块和规则挖掘处理模块6部分,对每一部分进行了详细的讨论。(5)设计了相应的系统,采用KDDCUP 1999数据集作为实验数据,进行了入侵检测的对比实验。实验证明,改进算法对于Probe、R2L和U2R类型的入侵行为,检测率较传统算法都有不同程度的提高,并且改进算法对于DoS、Probe类型的入侵行为的误报率较传统算法要低很多。此外,PSO-based K-means算法对于R2L和U2R类型的入侵行为的误报率也有不同程度的降低,其中对于R2L类型的数据误报率非常理想。总之,改进的k-means算法用于入侵检测有较好的效果。从而表明,本论文提出的算法对提高入侵检测性能有积极意义,具有较好的应用价值。