基于自然邻居的半监督入侵检测算法

来源 :重庆大学 | 被引量 : 0次 | 上传用户:qq2285387
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入侵检测系统是继防火墙技术之后的新一代安全保护措施,它通过对计算机系统或网络关键节点信息的采集、分析,从中发现与正常模式不同的异常行为,及时发出警报并处理。传统的入侵检测算法主要是基于监督学习和无监督学习的。基于监督学习的入侵检测算法虽然检测率高,但训练样本难以获取,训练集的建立依赖于安全领域专家,代价较高;基于无监督学习的入侵检测算法虽然不需要建立训练集,但检测率明显低于有监督的入侵检测算法。实际上,网络中不仅存在着大量无标签的数据,同时也存在一些带标签的数据,利用这部分带标签数据进行基于半监督学习的入侵检测,可以充分学习带标签数据含有的信息,提升检测算法的精度。在利用聚类的方法进行半监督入侵检测时,算法通常需要设置聚类个数,这个参数的选取非常困难,一般只能依赖大量的实验以及用户在实验过程中的经验。自然邻居是一种新的邻居概念,自然邻居的搜索不需要设置任何参数,完全由算法自适应产生,它完美的解决了参数设置的问题。本文结合了半监督学习和自然邻居概念,提出了一种基于自然邻居的半监督入侵检测算法(SID2N),算法首先对带标签数据按攻击类型分别做基于自然邻居的聚类,然后求出每个簇的簇中心作为分类器的样本,再对无标签数据做基于自然邻居的分类。算法的优势在于,不仅充分学习了网络中可获得的带标签数据的信息,而且不需要提供参数,算法完全是自适应的。本文从KDD CUP99的Corrected数据集中选取19999条记录作为实验数据集,首先对数据集进行了数值化、标准化和归一化,根据SPSS分析结果和属性的信息增益,从41个属性特征中选取了15个相关度最大的特征,然后对数据集的部分数据进行了标记,将基于自然邻居的半监督入侵检测算法的结果和SAID半监督入侵检测算法的结果做比较,实验证明,基于自然邻居的半监督入侵检测算法无论在检测率、误报率还是漏警率上都有优势,验证了算法的有效性;然后改变带标签数据的比例,分别对数据集的1/5数据、1/4数据和1/3数据做标记,用基于自然邻居的半监督入侵检测算法进行检测,结果显示,检测率、误报率、漏警率和检测精度的变化都不明显,验证了算法的稳定性。
其他文献
并发签名体制作为一种特殊的数字签名公平交换协议,自2004年Chen et al.在欧洲密码学会上提出以来,并发签名体制得到了广泛的关注和研究。运行这类协议使得交易双方或者同时
目前,细分曲面造型技术已被广泛的用于计算机动画,多分辨率分析等领域。细分曲面以其实现简单、可表示任意拓扑结构以及能更好的解决曲面间拼接问题的巨大优势,正逐渐取代NUR
随着网络和多媒体通信的发展,不同网络上各种视频信息的交流需求在不断增加。由于网络和终端设备的多样性,编码得到的视频流不一定是最优的。当在具有不同的信道特征的网络上
在当今互联网高速发展的时代,人们已经逐渐倾向于从网络上获取各种各样的信息。但是,随着用户和应用的日益增长,随之而来的流量剧增却使得网络变得更加拥塞,并直接导致了网络
在线社交网络中,异常账户是始终存在的。在现代社会,对于异常账户的检测通常使用的是信息本身的特征来设计,使用基于交互、基于排名、基于数据特征等方式来达到相应的检测目
视频目标跟踪是计算机视觉领域待解决的核心问题之一,它是一系列后续工作任务的基础。尽管视频目标跟踪已经经过了数十年的研究,且已经开发出许多高效的跟踪算法,但这些算法
近年来,随着3D显示技术的迅速发展,3D电视已成为我们日常生活中的一个重要电子产品。基于深度图像绘制(depth-image-based rendering,DIBR)是3D显示的关键技术。它能够合成一
人脸识别技术是一种利用计算机提取人脸图像中特殊表征信息并基于该信息实现对象匹配和分类的身份识别技术。在实际生活中,人脸图像的采集更方便和直接,因此人脸识别技术被广
计算机通信技术的飞速发展给数字产品的传播带来了极大的便利,与此同时数字产品也面临着日益严重的版权纠纷问题。如何对数字产品进行有效保护已经成为信息化时代一个迫切需
WEB文本挖掘是WEB数据挖掘的一个研究方向,WEB文本挖掘过程中最重要的是如何对文档内容进行有效分类,文本分类精度越高,WEB查询结果就越接近于理想的要求,在实际的应用中越能