基于随机森林算法的缓冲区溢出攻击检测研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:luoch668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前软件安全漏洞问题日益严重,针对这些漏洞形成的网络攻击也越来越难以发现,影响着网络社区的信息安全。其中针对缓冲区溢出漏洞形成的缓冲区溢出攻击是黑客主要的攻击手段,所以对缓冲区溢出攻击的检测和防御研究有着重要的意义。目前对缓冲区溢出的研究,主要集中在缓冲区溢出漏洞的挖掘分析,建立防御检测机制。缓冲区溢出攻击还没有被当前的数据挖掘算法很好的检测。本论文对能否更好的检测缓冲区溢出攻击进行研究,利用随机森林算法,学习缓冲区溢出攻击的特征,达到能够有效的检测缓冲区溢出攻击这一目标。研究分析了多种数据挖掘算法,发现随机森林算法对于噪声和过拟合的处理能力更强大,能处理成千上万种输入变量,也能适应于大数据集,并且能够从数据集给定的数据属性中确定重要的数据特征。决策树算法中节点分裂时选择最优属性的混合算法利用随机森林算法中在随机选择的属性子空间里选择属性分裂节点这一过程,将C4.5和分类回归树(Classification And Regression Tree,CART)算法中选择最优属性的信息熵理论计算方式进行线性组合,形成一个新的计算最优属性的公式,能够更好的选择分裂属性,成功构造决策树。然后使用预测试样本集对每棵决策树分类的正确率进行统计分析,运用公式计算每棵决策树相对应的权重因子,在最后的测试阶段,决策树采用多数投票机制对数据集进行分类,此时就需要考虑每棵树所拥有的权重因子,最后综合得出最佳的分类结果。通过实验研究了改进后的随机森林算法与其他数据挖掘方法如原有的随机森林(Random Forest,RF)算法,分类回归树和朴素贝叶斯(Naive Bayes,NB)相比,在检测缓冲区溢出攻击方面的有效性。实验结果表明改进后的随机森林算法对缓冲区溢出攻击的总体性能优于RF、CART和NB算法。并且使用改进后的随机森林算法识别的缓冲区溢出攻击重要变量进行实验,结果表明利用这些变量能够降低属性维度,并且进一步提高了改进后的随机森林算法以及其它数据挖掘算法对缓冲区溢出攻击的检测性能。
其他文献
<正>会展经济是通过举办大型会议、展览活动,带来源源不断的商流、物流、客流,不断创造商机、吸引投资,形成以会展活动为核心的经济现象和经济行为。近年来,部分地方邮政企业
目的:探讨如何建立较完整的动物药材品质评价体系,并提出以指纹图谱、灰关联度模型等要素构成的动物药材品质评价体系。方法:采用HPCE、HPLC进行各药材样品的指纹图谱构建;采
<正> 糖尿病抑郁症患者除有糖尿病症状外,还有一定的精神症状,严重的影响了病人的生存质量。为探讨糖尿病抑郁症患者的护理对策,应用Zung’s抑郁自评量表(SDS)对56例糖尿病抑
近年来,中药穴位贴敷疗法已广泛应用于小儿呼吸系统疾病。国内外许多学者对中药穴位贴敷治疗小儿呼吸系统疾病进行了相关研究,文章就中药穴位贴敷治疗小儿呼吸系统疾病的应用
重唱,是一种声乐演唱形式,能使歌唱的旋律得到极大的丰富,歌声的和声效果也得到进一步的体现,极大地提高了人声的艺术表现力。重唱是歌剧中不可缺少的环节,在歌剧中发挥着各
<正>近日,奇瑞重工出口埃塞俄比亚的2 400余台农业装备完成发交,这标志着奇瑞重工走进非洲又迈出重要一步。据联合国发布的报告指出,非洲制造业仅占全球制造业的1%,同时约占
该文对某危险废物处置中心工业危险废物焚烧产生飞灰的加速碳酸化过程进行了研究。测定飞灰中Cr、Ni、Cu、Zn、Cd、Hg、Pb等重金属浸出浓度,其中Pb浸出浓度超过危险废物鉴别
随着网络信息技术的不断发展,在信息爆炸时代的今天,“互联网+”教育正如火如荼地开展着,微课作为“互联网+”教育的有力推行形式之一,由于其短小、精炼、便捷、高效的优势深
<正>本讲介绍S7-200 SMART PLC的I/O地址分配、硬件组态的作用和组态方法,设置CPU参数及组态输入、输出参数的方法[1]。1 I/O地址分配与硬件组态1.1 I/O模块的地址分配S7-200
50年代在山西省北部地区为减小风沙危害,人们营造了大面积的小叶杨纯林,但随着时间推移,防护林功能逐年下降。为了提高林分稳定性,形成稳定的森林生态体系,营造了多树种混交林,并收