论文部分内容阅读
随着计算机网络技术的飞速发展,人们的工作以及日常生活越来越依赖于计算机以及网络。各种经济信息、军事信息、个人信息也随着网络逐步渗透到世界各地。与此同时,人们也感到虽然网络可以使工作效率大幅提高,但是随之而来的网络安全问题已越来越不可被忽视。网络安全问题不仅威胁个人信息安全也对国家安全造成相当影响。对于技术日益精湛的非法入侵者的恶意攻击与试探或者由于编码、设计的漏洞给系统带来的天生安全缺陷以及层出不穷的计算机病毒,现有的安全技术比如防火墙技术、身份验证技术、操作系统安全内核技术等已显得力不从心。集主动防护、动态监控、抵御系统入侵等优点于一身的入侵检测系统在最近十余年得到快速发展。此外,融合监督学习、无监督学习等机器学习算法的入侵检测系统己成时下研究应用热点,得到相关领域学者的广泛关注。本文在研究了国内外基于融合监督学习与无监督学习等多种机器学习算法的入侵检测系统的论文和相关材料的基础之上,提出了一种提高入侵检测性能的算法,此算法经过特征选择和新型特征表示并融合了聚类算法和分类算法。文章首先通过计算对应于每一具体攻击类型的所有特征的信息增益,对使用的实验数据集KDD CUP1999进行了特征选择。将冗余的、重复的对分类结果不起关键作用的特征删除,余下的特征均是对最后的分类结果起至关重要作用的特征。其次,利用K-means聚类算法对经特征选择后余下的数据进行聚类,聚成5类,取到5个聚类中心。接着,对于数据集中每一个数据点(样本),从5个聚类中心任意选出2个中心,这样会构成10种不同的选取组合。将每一次选取的2个中心与此数据点构成一个三角形,这样会得到10个不同的三角形。分别计算出每一个三角形的面积,用这10个面积作为此数据点的新的特征向量。最后,利用十倍交叉验证以及LibSVM对基于新特征向量的数据模型进行训练和测试,得出最终结果。此算法的正确率可达99.83%,检测率99.88%,误报率2.99%。这些指标均优于比较实验的结果。另外对于每一具体攻击类型进行检测的准确率和召回率也优于比较实验结果。