论文部分内容阅读
目前网络技术高度发达,互联网的应用已经深入社会的各个层面,极大促进了社会发展。但是互联网安全问题也日益突出,黑客攻击、隐私泄露等事件层出不穷,网络入侵行为甚至已经对我国的国家安全构成了威胁,对于网络安全技术的研究很有必要。在各种网络安全技术中,入侵检测是一种通过扫描分析网络数据流,探测异常活动的技术。这种技术能有效发现入侵行为,是目前的网络安全领域研究热点之一。在入侵检测的两类算法聚类和支持向量机中,支持向量机检测快、精度高,但需要已标类数据训练;聚类可以分类未标类数据,但检测速度和精度不够理想。本文结合了聚类算法和支持向量机算法,只需把训练数据集少量标类用于寻找参数,即可将未标记的训练集用聚类进行分类,将其作为支持向量机的训练数据,这样就能在无需手动标记大量样本的情况下完成支持向量机的训练。在检测阶段使用建立的支持向量机模型进行测试数据集的检测。以此融合算法优点,互相弥补缺点,将聚类算法能分类未标类数据的优点和支持向量机高精度高速度检测的优点结合起来,使得训练数据的准备工作更为简便,算法的实用度更高。在层次聚类方面,本文通过研究提出了改进层次聚类法,主要进行了两方面的工作:第一,在聚类计算的过程中引入一个距离矩阵,存储计算中需要用到的各个距离量,这样就能在保证正确率的情况下提高聚类速度,让入侵检测系统的训练更为高效。第二,提出了新的聚类参数寻找算法,该算法能够快速找到一个聚类参数的最优值,简化了参数的确定过程,提高了算法的运行效率,能够更为有效的完成相关实验。为进行相关研究,本文基于Visual C++平台,设计并实现了入侵检测实验系统,系统包含数据预处理、参数确定、数据训练、数据检测等模块。该系统功能完备,能够结合SQL数据库处理入侵数据。在数据预处理模块中,本文设计了能够量化多种数据集的通用量化法,能够自动识别数据集中的字符串,并为每种字符串分配唯一编号完成量化,扩展了系统使用范围。利用该系统进行了入侵检测的相关实验,并和已有研究成果进行了比较,验证了本文所研究的算法可以有效的检测入侵行为。