支持向量机增量学习、样本选择及新模型研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:az137724907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文所做工作是与支持向量机(Support Vector Machine-SVM)的在线增量学习、样本选择技术及新SVld分类模型相关的一些研究。   关于线性临近支持向量机(Proximal SVM-PSVM)存在着简单的训练算法,且适合进行增量学习;但非线性PSVM(Nolinear Proximal SVM-NPSVM)的训练要求对一个大小为训练样本点个数平方的矩阵求逆,存在着空间复杂度过大的问题;而且NPSVM不能像线性情形那样进行增量学习。从这些问题出发,做了如下的工作。   ●为了使NPSVM能够更加快速的进行在线增量学习,本文基于一个新的非线性PSVM模型设计了一种新的增量学习算法。该算法从新模型解的形式出发,利用分块矩阵求逆公式,有效地利用NPSVM分类器的历史训练结果,减少了在线学习过程中的重复学习,完成增量学习过程。理论推导及实验结果显示在线学习过程中采用该算法不仅可以得到与批量学习相同的分类器、正确率;而且解决了重复学习的问题,可以显著地缩短训练时间。   ●NPSVM的空间复杂度是与样本个数的平方成正比的,为了处理大数据集的增量学习问题,本文设计了针对历史数据、新数据和非线性数据分类器的样本选择技术。在线学习过程中,该样本选择技术不仅能够选择出历史数据集中最具代表性的样本点,而且能够选择出新数据中最具价值的样本点;此外对于比较复杂的非线性分类器也特别设计了相应的样本选择方法。实验显示上述样本选择技术仅需付出较小时间代价,就可以有效地处理大样本集的在线学习问题,而且可以得到与利用全部样本进行训练的结果相近的正确率。   ●设计了一种新的非线性SVM学习算法——Extreme SVM(ESVM)。ESVM是一种基于正则化最小二乘法的新的SVM分类器。与其它所有非线性SVM学习方法不同的是,ESVM不是使用核函数来得到非线性分类器,而是显式地构造了一个非线性的随机映射函数将输入样本点映射到一个特征空间中,然后在该特征空间中学习一个线性的分类器。该方法基于单隐层前馈神经网络(Single hidden Layer Feedforward Networks-SLFNs)的学习机制,在保持SLFNs学习能力的前提下,其输入权重可以随机地确定而不需要训练,这样SLFNs隐层神经元的作用相当于一个映射函数。理论分析及实验结果表明:ESVM可以有效地应用于大数据集的训练,不仅具有与SVM相当的正确率,而且极大地缩短了训练时间。另外,与SLFNs的学习算法ELM相比,ESVM将正则化理论引入到SLFNs的训练中,具有比ELM更好的泛化能力。
其他文献
随着集群技术和网络技术的飞速发展,网络存储系统成为解决集群I/O性能瓶颈的主要手段之一。集群文件系统作为网络存储系统的核心技术,很好地解决了传统文件系统中存在的性能、
机群系统凭借其良好的易构建性和可扩展性,无论是在高性能科学计算领域,还是在商业计算领域,都得到了广泛的应用。但是随着机群系统硬件规模的不断扩大以及应用的复杂化,系统出现
在计算机技术发展过程中,模拟一直是一个十分重要的研究方法。模拟器是运行在一个平台上的特殊程序,它可以模拟另外一个平台所具有的特征,前者称为宿主机,后者称为目标机。模拟器
近几年来,多模移动终端得到了越来越广泛的应用。目前的研究热点是使多模终端能够同时接入多个网络,利用多种无线资源相互配合进行业务流传输。在这种通信模式下,当原有接入网络
链接预测是属性网络中常见的一类任务,即预测两个节点之间的边存在的可能性,核心在于构建有效的链接表示。传统的方法往往依靠费时费力的特征工程,但是近年来,表示学习和深度学习
在今天的开放计算环境和数据中心中,计算机系统需要根据提供服务类型的不同而划分成多个子系统进行管理和维护,各个子系统之间相互孤立,很难实现资源的共享,面对不断变化的服务需
随着用户数据重要性的增加,基于周期性备份的数据解决方案已不能满足用户数据保护的需要。连续数据保护技术(CDP)成为近年来数据保护领域的一大研究热点,它有效解决了周期性备
传统的文本分类算法在进行大规模数据的学习时效率低下,甚至无效。增量学习能使学习算法的时间和空间资源消耗保持在可以管理和控制的水平,具有较高的实用价值。现有的增量学习
对等网络研究及应用的不断发展使其吸引了越来越多的关注。基于对等网络的流媒体数据传输技术充分利用对等网络参与节点相互协作的特性,取得了很好的应用效果,对互联网络从文本
软件过程建模是指对软件过程建立模型,并且对模型建立和模型执行提供自动化支持。软件过程建模技术为软件过程的描述、表示、执行、分析、跟踪、变更以及改进提供了方法和工具