SVM数据提取与聚类分类方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:lxfa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机由于其出色的推广能力,在近几年得到广泛的研究。虽然支持向量机在两分类和多分类方面都取得很大进展,但是仍有待进一步的研究和改善。在两分类中,SVM在大规模数据上训练速度很慢,利用数据提取的方法可以减少训练样本数目,从而加快训练速度。 本文利用马氏距离和“aσ-方法”提出新的数据提取方法,在进行数据提取时根据样本点到训练集的马氏距离来确定样本点与样本集的位置关系,从而只提取对于建立超平面有作用的样本点,并避免了以往的数据提取方法很强的随机性。在数据提取的过程中还考虑到了提取的数据占原来总样本集数目的比例,通过调整a的值,可以控制数据提取的数量,避免提取后训练样本集的数据太多或太少,并加快了支持向量机的训练速度。对于多分类问题,本文在聚类分类的基础上,根据二叉树思想,提出了一种新的聚类算法来进行多分类。此方法充分利用二叉树中分两类的简便之处,将多类的聚类简化为点的聚类,从而避免了以往聚类方法中可能出现的同一类的点在聚类中变成不同类的问题,并结合选址问题中固定数目的配送点的选址算法,将原问题进行简化,对多分类问题提出了新的聚类算法。
其他文献
本论文以带利率的破产概率为主线展开讨论,主要研究了连续时间复合二项模型。我们这里认为连续时间复合二项模型{U(t)}是Gerber的复合二项模型(离散时间复合二项模型)的连续化
本论文共分为五章内容。主要研究了刚性奇异延迟微分方程系统的数值方法,提出了求解奇异和非奇异延迟微分方程的两步连续Runge-Kutta方法、求解刚性奇异和非奇异延迟微分方程
首先,本文研究了类p-Laplacian方程的无穷多解问题(公式略)其次,我们研究了如下方程的特征值问题(公式略)其中Ω是Rn中的有界区域,λ>0是实数.在缺少Ambrosetti-Rabinowitz条
金融数学是一门新兴交叉学科,在国际金融界和应用数学界受到高度重视.它涉及现代金融学的资产定价理论、投资组合理论以及现代数学中的随机分析、随机控制、优化理论、数理统
设图G是一个具有边染色的非平凡连通图,其中相邻边可以染相同颜色。称图G的一条路是彩虹路,如果这条路上的任意两条边都染不同颜色。如果对图G的任意两个顶点u和v,都存在一条彩
半群代数理论是代数学的一个重要分支。自半群的系统研究至今,正则半群及其子类的研究总是半群理论研究中的一个主流方向。半个多世纪以来,拟正则半群作为正则半群的一个重要推
最优化问题从产生发展到现在,众多的学者和数学家已经提出了许多最优化方法。但应该指出,目前通常的算法求得的都是局部极小点,仅当问题具有某种凸性时,局部极小点才是全局极小点
对系统微观结构的探索来说,在分子动力学方法计算机模拟所得的液态和非晶态的相轨道基础上的几何学研究是极具重要性的。本文主要涉及分子动力学模拟所得的构型中微观空洞和De