论文部分内容阅读
20世纪90年代中期,在统计学习理论的基础上发展起来了一种新的模式识别方法.这是由V.N.Vapnik等人提出的支持向量分类机(SVM).它是解决分类问题的一种有效算法.支持向量分类机在数字识别,数据挖掘和信息处理等实际问题中有非常广泛的应用,近年来有了迅猛的发展.
考虑到在许多实际问题中,构造描述目标之间关系的距离函数比构造支持向量机中的核函数更容易更自然,且在没有度量空间的先验信息的情况下,可以利用度量的特性构造度量空间中数据的分类算法,本文讨论度量空间中的分类问题.M.Hein和O.Bousquet等人构造了度量空间中的最大间隔分类算法.但是,在实际问题中,样本不一定是可分的,且最优超平面也不一定都存在.因此我们在其所做工作的基础上讨论度量空间中的软间隔分类问题,并得到了两个主要结果:首先构造了度量空间中的软间隔分类算法,然后通过改进分类算法中的核函数增大了支持向量分类机对训练样本的分类间隔.主要内容安排如下:
第一部分:介绍分类问题和支持向量机的基本思想.
第二部分:通过度量与核函数之间的转化关系构造度量空间中的最大间隔分类算法.
第三部分:在M.Hein和O.Bousquet等人所作工作的基础上,构造了度量空间中样本线性不可分情形下的软间隔分类算法.
第四部分:讨论分类算法中核函数的选取与改进.通过最小化VC维的上界选择核函数的参数.利用核函数在输入空间诱导的黎曼几何结构改进核函数,增大支持向量机对样本的分类间隔.
最后,在第五部分中,分析了前面部分得到的两个主要结果,并对未来研究工作方向进行了展望.