基于低秩变换的分类判别模型

来源 :浙江大学 | 被引量 : 0次 | 上传用户:hordark
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是数据挖掘中应用领域极其广泛的重要技术之一,这篇文章主要介绍了一种基于矩阵低秩变换的判别分类方法。因为许多高维数据,都是近似存在于一些低维子空间中的,所以我们的想法就是把这些高维数据依据它们所在的潜在低维子空间进行分类。具体做法就是先利用有类标的数据集学习一个全局的线性变换,然后将数据变换到一个类别更加明显、更易进行分类的投影空间中去,再对数据进行分类。此外,这种方法也可以作为一种有效的特征提取方法,它能够保证样本在投影后的空间中有最佳的分离性。  文章先介绍了一个低秩变换的分类模型,这个模型将核范数作为建模和优化的准则,在子空间上学习一个投影矩阵。这个学习到的投影矩阵保留了来自同一子空间的数据的低秩结构,同时使来自不同子空间的那些数据得到最大分离。然后,我们对这个方法进行了改进,加入了一个判别项。这个判别项的作用是在原模型增大不同类别数据类间距的基础之上,使得同类数据类内距更小,从而获得更好的分类效果。这个判别分类模型充分利用了已知类别的多方位信息,比原模型鲁棒性更强。本文分别通过理论分析和数据实验,阐释了模型的合理性并且验证了实验的效果。文中采用一个基于次梯度的方法对模型进行了求解并对算法收敛性进行了分析。最后对模拟数据和实际数据进行实验的结果均表明我们的方法取得了比原模型更优的分类效果。
其他文献
三状态可修系统的可靠性分析是可靠性研究中重要的内容之一。在可修模型中,串并联、冷贮备和温贮备可修系统是三个非常重要的模型。论文在参考文献的基础上,推广了这三个三状态
本文在通常故障的条件下,研究了具有热储备并联可修复系统模型的可靠性分析。首先运用Volterra积分方程和C0-半群理论,证明出了该模型的非负解的存在唯一性,其次结合泛函分析中
Stalk related traits, comprising plant height (PH), ear height (EH), internode number (IN), average internode length (AIL), stalk diameter (SD), and ear height
这篇文章中,我们获得了不大于T个节点的任意二叉树S到n维k阶组合星图CS的嵌入.该嵌入的膨胀度(dilation)为常数,扩张度(expansion)不大于n.我们定义了排列上的圈操作并将[1]
以兖矿集团南屯煤矿为例,对国有煤矿实现可持续发展的途径进行了探讨,提出了安全发展、持续发展、和谐发展的三个方向。 Taking Nantun Coal Mine of Yankuang Group as an
在信息飞速发展的时代,通信在生产和生活中的地位日益重要,其中移动通信这种不受时空限制的通信方式业已得到各国通信专家和用户的关注。从90年代初到现在,GSM(Global System fo
小波分析是目前数学中一个迅速发展的研究领域。它具有理论深刻和应用十分广泛的双重意义,尺度函数与小波的构造对小波分析理论和应用的研究都具有重要的意义,并引起越来越多
本文主要考虑了变指数空间Lp(·)中K-泛函与光滑模等价性的刻画.我们首先介绍了K-泛函和光滑模在函数逼近论中描述函数光滑性和算子逼近阶的估计中的应用。在此基础上我们引入
曲线/(曲面)造型是计算机辅助几何设计(CAGD)的一个重要研究方向,它在汽车、造船、航空、模具等待业的外形设计和制造中有着广泛的应用.CAGD发展至今,出现了很多的曲线(曲面)
设G是至少具有两个完美匹配的平面二部图,它的完美匹配的Z-变换图是定义在G的完美匹配集合上的图,两顶点相邻当且仅当它们对应的完美匹配的对称差恰是一个圈且为G的某个内面