论文部分内容阅读
1995年,Cortes和Vapnik首先提出了支持向量机(SVM)理论,它是结构风险化准则的具体实现,且具有结构简单、全局最优以及泛化能力强的优点,特别是在解决小样本、非线性和高维模式中表现出特别的优势。因此该技术在许多领域得到成功的应用。但是支持向量机有一个十分明显的缺点是训练阶段以及测试阶段都需要花费大量的时间。这些缺点限制了支持向量机的应用,特别是对时间要求严格的应用,例如入侵检测,它最大的要求就是能做到实时性,即对网络数据做出及时的决策,进而及时地制止入侵行为。要想将支持向量机成功的应用到入侵检测,上面的缺点必须要得到解决,使之能做到实时决策。超球结构支持向量机(HSSVM)在一定程度上改进了传统支持向量机的上述缺点,其思想是对于每一类的样本,首先用一个较小的超球包裹样本,允许偏远的离群点位于超球的外部。然后通过度量-个新样本与超球的球心距离来判断该新样本是否属于该类。考虑用一个较小的超球来包裹样本,且允许远离球心的偏远样本点落在球体外部。但是现实情况是在大多数基于距离方程的核函数(如高斯核函数)中,样本点在原输入特征空间中比较密集,而当映射到高维空间后,样本点会变的非常稀疏。这就直接导致了包裹样本的超球必须增大,超球的重叠数目增加,进而降低了分类准确率。本文将从两个方面对(超球结构多类支持向量机)HSSVM进行改进,一是在原目标函数中增加一个参数,使超球尽可能多地包裹靠近球心的样本。二是通过构造映射密集型核函数使样本点经过非线性映射后仍能保持紧凑,从而减少对重叠区域的判断。最后给出了基于K近邻算法(KNN)的超球重叠区域判断算法。主要工作如下:(1)利用核模糊聚类算法,提出了基于隶属度的样本预选取方法。利用一定的隶属度间隔,选取靠近支持向量机分类超平面的样本来训练分类模型。该方法不仅能够较大地减少训练和测试时间,而且分类准确率毫不逊于利用全部样本训练所得到的分类模型。(2)在目标函数和核函数稀疏性两个方面对超球结构支持向量机进行了改进,提出了6-超球结构多类支持向量机(δ-Hypersphere Multiclass SVM)。实验验证了该方法要优于同类算法。(3)按照网络协议把网络数据分流,给出了基于6-超球结构支持向量机的协同入侵检测方法,仿真实验表明:该方法比单一的检测代理检测率高、检测时间少。