论文部分内容阅读
随着计算机网络的爆炸式发展,如何保障网络安全成为人们亟需解决的问题。入侵检测系统在网络安全方面发挥的积极作用使它成为人们关注和研究的焦点之一。虽然人们已经将数据挖掘和模式识别算法应用到了入侵检测领域,但是效果并不理想。因为入侵检测系统的输入是非平衡数据,与传统分类器不同,入侵检测数据的少数类样本才是人们关注的核心。传统分类器和性能评估指标是针对平衡数据集的,通过预处理使数据平衡化是入侵检测系统有效运行的关键。KDD Cup99数据集是本文仿真实验采用的数据集。针对数据不平衡的问题,本文对经典SMOTE过抽样算法进行改进;针对入侵检测数据高维度的特点,应用基于信息增益的特征选择算法和面向目标变量的主成分分析算法对数据降维。最后,采用了传统的贝叶斯分类器对平衡降维后的数据进行分类操作。针对入侵检测数据非平衡的特点,本文实验综合参考检测率、误报率、G-means和整体准确率四个指标来分析评价入侵检测系统的性能。实验仿真结果表明,提出的预处理方案可在维持较低误报率的情况下有效提高入侵检测系统的检测率和整体准确率。