K-means和TASVM及特征选择算法在入侵检测系统中的应用

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:nike880713
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络技术的飞速发展,人们的工作以及日常生活越来越依赖于计算机以及网络。各种经济信息、军事信息、个人信息也随着网络逐步渗透到世界各地。与此同时,人们也感到虽然网络可以使工作效率大幅提高,但是随之而来的网络安全问题已越来越不可被忽视。网络安全问题不仅威胁个人信息安全也对国家安全造成相当影响。对于技术日益精湛的非法入侵者的恶意攻击与试探或者由于编码、设计的漏洞给系统带来的天生安全缺陷以及层出不穷的计算机病毒,现有的安全技术比如防火墙技术、身份验证技术、操作系统安全内核技术等已显得力不从心。集主动防护、动态监控、抵御系统入侵等优点于一身的入侵检测系统在最近十余年得到快速发展。此外,融合监督学习、无监督学习等机器学习算法的入侵检测系统己成时下研究应用热点,得到相关领域学者的广泛关注。本文在研究了国内外基于融合监督学习与无监督学习等多种机器学习算法的入侵检测系统的论文和相关材料的基础之上,提出了一种提高入侵检测性能的算法,此算法经过特征选择和新型特征表示并融合了聚类算法和分类算法。文章首先通过计算对应于每一具体攻击类型的所有特征的信息增益,对使用的实验数据集KDD CUP1999进行了特征选择。将冗余的、重复的对分类结果不起关键作用的特征删除,余下的特征均是对最后的分类结果起至关重要作用的特征。其次,利用K-means聚类算法对经特征选择后余下的数据进行聚类,聚成5类,取到5个聚类中心。接着,对于数据集中每一个数据点(样本),从5个聚类中心任意选出2个中心,这样会构成10种不同的选取组合。将每一次选取的2个中心与此数据点构成一个三角形,这样会得到10个不同的三角形。分别计算出每一个三角形的面积,用这10个面积作为此数据点的新的特征向量。最后,利用十倍交叉验证以及LibSVM对基于新特征向量的数据模型进行训练和测试,得出最终结果。此算法的正确率可达99.83%,检测率99.88%,误报率2.99%。这些指标均优于比较实验的结果。另外对于每一具体攻击类型进行检测的准确率和召回率也优于比较实验结果。
其他文献
随机共振是近年来提出的一种新的非线性弱信号检测方法,它可利用噪声来增强有用信号,达到检测弱信号的目的。本文重点研究基于随机共振理论的强噪声背景下非周期信号检测方法
本文提出了一种基于XML (Extensible Markup Language,可扩展标记语言)异构数据库结构和数据交互的方法,分别制定关系数据库的结构和数据的映射规则RXI (Relation XML Intera
随着网络技术的不断发展,计算机网络正在日益广泛地深入到人们日常生活中的各个领域,并慢慢改变着社会的行为和面貌。但是,于此同时,计算机网络的安全问题也日益突出。入侵防
随着P2P实时流媒体在网络上的流行,在ISP主干链路的流量中,P2P实时流媒体应用占有相当大的比例。尽管ISP通过部署缓存设备的方法有效缓解了Web和VOD流媒体所产生的流量压力,
拟插值作为一种逼近方法在计算机辅助几何设计、数据分析等领域有广泛应用,尤其在逆向工程领域,它能够直接拟合散乱数据点而不需要所有插值点都落在目标曲线或曲面上,在处理
目前,随着多核处理器的迅速发展,单核时代已经成为历史,尤其是由多个多核处理器组成的多处理器系统,更是为应用软件性能改善提供了硬件基础。然而我们的软件却大多停留在单核时代
近年来,随着“互联网+”模式的兴起,社会各行各业正在发生创新性变革,其中“互联网+教育”新形态对传统教育产生巨大影响。教学活动围绕互联网平台展开,这种方式极大地拓展了
伴随着计算机科学技术的发展,企业信息系统的开发技术在不断发展。为了应对全球化的激烈竞争,我国的相关企业越来越重视信息化建设和规范化管理。虽然信息系统的开发有一定程
传统的分类问题需要通过大量的标记样本进行学习,以预测未来样本的标记。然而在实际的分类应用中,比如图像分析、网页分类、蛋白质结构预测等,标记样本往往数量比较少,获取成本比
随着现代网络信息技术的发展,计算机网络给人们的工作、学习带来很多益处,随之也产生了一些网络安全问题。近年来,网络安全事件频发,网络信息技术受到严重威胁,然而传统的网络安全