论文部分内容阅读
本研究小组早期提出了对支持向量机(SVM)的多项式核函数及支持向量回归机(SVR)的B_n-splines核函数的几何修正方法。本文对这两种方法中的参数进行了分析,确定了参数的取值范围及参数之间的关系。旨在通过对参数的准确选取,使得核函数的体积元在支持向量附近改变,从而达到修改的目的,提高SVM及SVR的精度,并且减少支持向量(SV)的数目使数据压缩。 依据参数理论分析的结果,对两种核函数都进行了相应的数值实验。对SVM采用了拟南芥全序列数据,对序列中的编码区序列和非编码区序列进行了研究。对序列中的所有窗口序列都给出相对差α,根据α分别得到编码区序列和非编码区序列的特征序列。在此基础上给出了DNA序列的特征向量表示,并用修改前后的SVM分类器进行分类。实验结果表明,当参数满足给定条件,修改后SVM的分类结果有很大的改进。对SVR作了人工数据和自然数据的函数逼近实验,同样取得了很好的结果,特别是自然数据的结果中误差和SV的数目大大减少。