基于机器学习的网络入侵检测技术研究与实现

来源 :广东工业大学 | 被引量 : 7次 | 上传用户:csh911229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络应用的普及,网络安全问题也随之而来,网络攻击也朝着多样化,复杂化和分布式的方向发展。入侵检测系统是发现攻击的第二道防线,其可以对网络中事件进行实时监控,是一种主动的防御技术,弥补防火墙的不足。近年来,随着机器学习的发展,使现有入侵检测与处理有了更为有效的机制,面对大规模的网络数据,由于机器学习算法本身的缺陷和不稳定性,目前仍存在检测准确率低和误报率高,并且检测效率低等难题,研究基于机器学习的网络入侵检测技术具有重要的理论意义和应用价值。本文的主要研究工作包括:(1)介绍了网络入侵检测技术的研究背景和研究意义,综述了国内外研究现状,概括了入侵检测和机器学习相关的理论知识,总结了常见的入侵检测技术,分析了入侵检测常用的机器学习算法。(2)针对网络数据存在大量冗余特征导致检测算法效率和准确率降低的问题,研究基于改进的随机森林(Improved Random Forest)特征选择算法和支持向量机(SVM)的入侵检测方法,通过权重投票融合基于OOB数据分类正确性和曲线下面积置换两种特征重要性度量方法,采用序列向后搜索策略,搜索获得了最优特征子集,解决了实验中数据存在冗余问题。设计了在KDD CUP99数据集上的仿真实验,进行了检测效率和检测准确率的实验结果比较和分析。(3)针对现有的入侵检测算法适应性不强以及检测准确率低的问题,研究基于深度学习多分类器集成方法。采用stacking技术对SVM、NB、KNN、DT等四个分类器的集成,解决了权重投票的集成学习技术只能学习分类器之间线性关系的问题,克服了单个分类算法的缺陷。设计了五层神经网络的仿真实验,并进行了实验结果进行了比较和分析。本文的创新之处包括:(1)提出了一种改进的基于IRF-SVM入侵检测方法,通过改进随机森林特征选择算法,使用权重投票技术融合基于OOB数据分类正确性和曲线下面积置换两种特征重要性度量方法,解决网络数据中存在冗余特征的问题。在KDD CUP99数据集上的实验结果表明,该方法对Normal、DOS、Probe、R2L、U2R的检测准确率分别为98.35%、98.72%、97.63%、93.64%、96.85%,比经典的SVM模型的检测准确率有较好的提高。(2)提出了一种基于深度学习多分类器集成的入侵检测方法,该方法通过深度学习算法集成了SVM、NB、KNN、DT四个分类器,增强了检测算法的稳定性。实验结果表明,该方法对Normal、DOS、Probe、R2L、U2R检测准确率分别为99.76%、99.88%、99.42%、98,63%、98.52%,明显高于基于权重投票算法的分类准确率。
其他文献
最新调查显示,国内棉花种植面积10年来首次跌破467万hm2,同比下降6.8%。为稳定市场预期,国家发改委相关负责人表示,今年将继续实行棉花敞开收储政策,具体价格将在近期向社会
目的 探讨穿心莲内酯是否有增强平阳霉素抗人口腔鳞癌细胞的作用,并探讨其潜在作用机制。方法 MTT法检测不同浓度的穿心莲内酯与平阳霉素联合应用对人口腔鳞癌细胞SCC-9细胞
针对多颗地球静止轨道(GEO)卫星氢镍蓄电池组压力数据在轨正向漂移的现象,文章分析了测量方式及温度对压力遥测的影响,提出基于小波分析和平稳时间序列分析的数据趋势项提取方
内蒙古中部广泛分布的岩浆岩具有明显的分带特征,可以划分为南,北两区,而且在每个区内又划分出次级的岩浆岩带,岩浆岩形成时代,演化顺序,成因类型和构造环境均有一定规律可循,本区岩
中风是以猝然昏扑不省人事或突然发生口眼歪斜,言语不利,半身不遂为主证的疾病。多发于中老年,近几年,年龄组明显提前,由于病程长,反复发作,再加上生活不能自理,使得家庭残缺
深入讨论了交叉极化干扰的工程化问题,详细分析了自适应交叉极化信号产生的天线极化特性和幅相控制要求,阐述了该技术工程实现方面的边界条件,对该技术在实际装备的应用提供
爱滋病(H IV)感染者/AIDS患者窗口期全身症状不明显,不易早期发现。在AIDS发病的前1~4年内,大多数患者会首先出现口腔症状[1],70%~90%的H IV感染者至少有一种口腔表现[2],有
北京建设全国创新中心的路径,这个课题是想跟大家共同探讨科创中心有没有一般性的规律,怎么推进,框架思路是怎么样的,希望有一些碰撞。要做路径首先要研究它的功能是什么,在明确功
阐述了利用MES系统平台,实现对石化企业工厂物料在生产过程各层面的规范管理。探讨了利用MES系统数据的及时性、完整性和准确性,通过物料平衡、统计报表、数据对比分析等方法
伴随着“大数据时代”的深入以及互联网技术、云计算技术和智能设备的普及,全球数据量每年将以40%的速度增长,到2020年将达到35ZB(Zettabyte),大数据将迎来ZB时代。传统以追