论文部分内容阅读
支持向量机是建立在统计学习理论基础上的一种新型机器学习方法,较好的解决了非线性、高维度、局部极小等问题,成功的应用于小样本、高维度数据的学习中。但是,当训练样本中含有模糊信息或者噪声时,其性能将大大下降。模糊支持向量机将支持向量机与模糊集理论相结合,拓宽了支持向量机的应用范围。但是,作为一种新兴的研究方法,模糊支持向量机还有很多需要研究的内容,本文主要从两个方面对模糊支持向量机进行研究。第一部分主要研究模糊支持向量机中隶属度确定的方法,通过分析基于紧密度的模糊支持向量机方法中存在的问题,确定了这一部分需要研究的内容。针对支持向量数据描述方法对野值敏感,最小超球的球心可能出现较大偏差的问题,本文预先剔除样本中可能的野值,对最小超球进行了修正。针对基于紧密度的模糊支持向量机在确定隶属度时,缺乏考虑其它类对隶属度影响的问题,本文分析了隶属度的含义,提出了一种更加可信的隶属度确定方法。第二部分主要研究模糊支持向量机中样本选择的方法。针对模糊支持向量机样本选择困难,选样率高的问题,本文利用阴影集对模糊集的分析能力,提出阴影集映射应该『呆持集合的模糊性不变,并将原模糊集合划分为可信任数据集合、不可信任数据集合以及不确定数据集合。在可信任数据集合和不确定数据分别采用核子空间样本选择以及边界向量提取的方法进行选样,继而得到基于阴影集的样本选择方法。最后,本文分别利用仿真数据集以及标准数据库中的数据集对以上两种方法进行实验:利用二维近似可分的仿真数据集给出直观的实验结果,对方法进行详细分析;利用标准数据库中的数据集给出非线性可分情况下方法的实验结果。其中,隶属度确定方法的验证部分,实验表明去野值支持向量数据描述方法可以较为有效的修正最小超球的位置,可信的基于紧密度的隶属度确定方法较一般的基于紧密度的隶属度确定方法,对应的模糊支持向量机具有更好的分类性能和抗噪能力。样本选择方法的验证部分,实验表明基于阴影集的样本选择方法的选样率较低,并且,可以『呆持模糊支持向量机的泛化能力。由于该方法去除了样本中的不可信任数据,当训练样本中含有噪声时,分类器的泛化能力可以得到提高。