基于数据挖掘的异常检测和多步入侵警报关联方法研究

被引量 : 0次 | 上传用户:mimistart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的出现为人们之间信息交流提供了一个快速便利的平台,人们在享受服务的同时,往往还要慎重考虑如何有效的保护信息完整性、隐密性和可用性,这就涉及到对信息系统安全的保障。信息系统安全保障是一种防御体系,包括防护(protect)、检测(detect)、反应(react)和恢复(recovery)4个层面。入侵检测系统是其中一个重要的组成部分,扮演着计算机应用环境下“监督预警”角色。入侵检测通过收集操作系统、系统程序、应用程序、网络包等信息,发现违背安全策略或危及系统安全的行为。具有入侵检测功能的系统称为入侵检测系统,简称IDS。入侵检测系统本身的应用要求与一般的信息系统不同,入侵检测系统的安全策略要求收集尽量完整的数据,处理海量的警报有时要比对警报进行关联性分析要难的多,同时对计算要求的提高需要更高级别的硬件支持,会大大增加了应用的成本。通过赛门铁克和多个安全机构的报告,现在的网络安全状况已经由“单纯的”木马病毒的独立侵害或攻击单体的情况发展到基于“互联网+攻击团队+病毒+商业利益”联合在一起的攻击集体。针对近几年层出不穷的新型攻击和复杂多样的多步攻击,现有的入侵检测系统大多还不具备网络多步入侵的检测功能,因此国内外针对未知攻击和具有多阶段攻击过程的多步攻击的识别都展开了深入研究,并在告警关联领域取得了一定研究成果(这里要强调一点,本文的多步入侵警报关联属于告警关联方法是针对入侵检测的领域化方法研究)。有关告警关联和多步入侵的研究的应用现状,可以从在线和离线角度来分析阐述,如下两点:1)在线的入侵告警关联系统,为了提高数据兼容性,进行告警资源整合,因而检测率不高,误报率较高,同时针对多步入侵的检测识别方面研究成果很少。2)离线的关联检测率相对在线要高,但资源消耗大,不适合应用到实际应用中。本文针对现在入侵检测系统单个警报的提高检测率和降低误报率方面,以及多个警报之间的关联分析后进行多步入侵的识别方面展开研究工作,主要成果如下四个方面:1.多步入侵警报关联模型(1个模型)为了提高研究成果的实用性,针对真实应用需求,提出了基于数据挖掘的异常检测和多步入侵警报关联模型。跟国内外已有的研究成果相比,本部分主要工作整合了数据挖掘的相关方法,提出了一套可用的应用模型和建议。2.适用于异常检测的入侵关键特征(2个算法)为了提高警报数据的分析效率和效果,着重研究了数据属性的压缩技术,进行了入侵检测所要分析数据的关键属性分析工作。根据数据挖掘经典的关键属性的分析方法,采用标准的网络入侵数据集,并结合入侵检测环境下的检测特征,提出了适用于入侵检测领域的关键属性特征分析方法,并与此领域已有的研究成果进行了比较、讨论和给出了实验结果,通过实验验证了本文关键属性在异常检测领域的可用性。3.异常检测方法研究(1个算法)为了提高入侵检测的检测效果,着重研究了异常检测方法,进行了针对噪声数据离群点的聚类分析方法研究。根据入侵检测数据的特征,并结合实时检测的需要,提出了针对入侵检测实时环境的剪枝优化策略和方法,同时进行了充分的实验,并与异常检测已有的研究成果进行了比较和讨论,通过实验验证本文方法的可用价值和存在的不足,为以后的研究人员提供的此领域下的研究思路和实验数据参考。4.多步入侵警报关联方法研究(6个算法)为了实现协同/多步攻击形成的检测工作,着重研究了数据过滤、数据融合和数据的关联分析方法,进行了针对单入侵警报的数据过滤预处理、多源入侵警报融合和多步入侵警报关联分析方法研究。根据入侵检测的数据特征,采用基于概率、模糊数学和逻辑描述的分析方法,并结合入侵检测环境下的规则要求,提出基于概率的误报滤除、基于模糊数学的警报融合、基于概率和基于模糊的多步入侵警报关联方法,并进行了基于逻辑描述语言的多步入侵警报描述方法研究。同时与此领域已有的相关研究成果进行了比较和讨论,为将来进行智能化的多步入侵检测的研究工作提供了参考和相关数据,为之后的研究者进行此领域的研究提供实用的研究思路、实验方法和实验结果。本文工作主要创新点,概述如下四点:1)提出了一个基于数据挖掘的异常检测和多步入侵警报关联模型框架,基于框架展开了本文研究工作,本文框架根据应用角度提出,具有较好的可延展性。2)提出了适用于异常检测领域的入侵关键特征属性结果,与国外已有的在入侵检测领域的特征选择结果进行比较发现,本文的重要属性和均重要属性属于国外成果的子集。通过在KDD1999数据集的实验,在对准确率影响很小的情况下,检测时间能够缩短7%-16%,这有利于提高异常检测方法的实时性的应用效果。3)提出了一个具有实时使用价值的异常检测算法ADTSFC(anomaly detection withtime-stamp frequent pattern-based clustering),它基于BIRCH和ADWICE,能够进行增量检测,是带时间戳频繁模式的聚类异常检测算法。通过算法通过KDD1999数据集上的实验比较证明,可有效减少误报率,同时大大提高了检测率,相对ADWICE的检测率提高平均有10%以上,同时有效减少消耗的时空资源。4)提出了智能规划领域的形式化逻辑描述语言PDDL在多步入侵检测领域的描述方法,并通过DARPA2000数据集验证表示结果的可靠性,便于以后开展智能规划领域在入侵检测领域的扩展。(这方面在本文论文结束时还未查找到相似研究工作)我们的研究梯队一直在关注和开展网络安全方面的研究,取得了一些成果,希望能得到其他研究者的关注和指导,并进行合作和进一步交流。
其他文献
<正> 血清弹性蛋白酶-1是一种弹性蛋白水解酶.它在急性胰腺炎中起重要作用.本文作者对其在急性胰腺炎及其他胰腺疾病中的诊断价值及其特异性与敏感性进行了研究.
概述了未来人类对过量二氧化碳排放的处理办法,即碳的捕获和存储(CCS)。简介了4种二氧化碳的分离工艺及特点和工业中二氧化碳的捕获系统。阐述了变压吸附工艺的基本原理和其
焦化炉是焦化装置的核心设备,提高加热炉热效率,是降低装置能耗、提高经济效益的关键所在。通过对焦化炉能耗、热效率影响因素的分析,提出了相应的应对措施。
轧制是金属塑性成型的重要方法,轧制成型的钢材是数量最大的金属材料制品。在诸多轧制产品中,棒线材由于断面形状简单,品种繁多,所以其用途非常广泛。随着现代工业的飞速发展
随着社会经济的快速发展,农民的生活水平逐渐提高,对电量的需求不断增加。面对这种情况,供电企业就需要大力发展农村业务,提高农电营销的精准化水平,以便更好的满足农民生活
随着经济的发展,智能交通系统的深入研究显得日益重要,车辆识别技术作为智能交通系统的一个重要方向逐渐受到重视。车辆识别技术可以应用于高速公路管理系统、停车场管理系统
中国社会转型始于上世纪七十年代末,它是以改革开放为动力、以现代化为核心、以全球化为背景推进的,转型期既充满机遇,又面临多重挑战;党的十六大报告指出,发展社会主义民主政治,建
目的:探讨有机阴离子转运多肽4A1(OATP4A1)、OATP2B1在妊娠期肝内胆汁淤积症(ICP)胎盘中表达的意义。方法:选择2011年8月—2012年8月在湖北医药学院附属太和医院产科行剖宫产
我国高瓦斯矿井多,煤层气资源丰富。但是由于地质条件复杂、开发技术滞后、理论研究不完善,导致煤层气采出率低、难以实现工业化开采的现状。为提高煤层气的开采效率,必须在
随着城市经济和社会的发展,人民生活水平的提高,小汽车拥有量也快速攀升,个性化交通出行需求的快速增加,加上城市自然资源的有限性从而导致日趋严重的城市交通问题。由于城市