【摘 要】
:
在传统的机器学习分类方法中,将只通过未标记样本进行分类的方法称为无监督分类,如聚类方法,无监督分类方法所取得的分类精度通常难以达标;将利用有标记样本集训练分类器的方法称
论文部分内容阅读
在传统的机器学习分类方法中,将只通过未标记样本进行分类的方法称为无监督分类,如聚类方法,无监督分类方法所取得的分类精度通常难以达标;将利用有标记样本集训练分类器的方法称为有监督分类(或监督分类)。然而,现实应用中获得有标记样本的成本通常很高,需要花费人力和物力对样本进行标注。半监督学习是指在充分利用有标记样本的基础上,通过预测或传播算法将可信度较高的未标记样本转换为伪标记样本进行分类的方法,达到同时利用标记样本和未标记样本构造分类器的目的。 由于既可以降低成本又可以得到较高的分类精度,在理论和实践中,半监督学习受到了广泛关注,它对提高学习性能有着重要指导意义。在半监督学习方法中,由于在实践中实证性的成功和较高的计算效率,基于图的半监督学习方法成为了最流行的一种半监督学习方法。我们发现,虽然基于图的半监督学习方法最重要的一个步骤是构造图,但如何去构造一个好图至今没有得到很好的研究。针对这个问题,我们对现有图的构造方法进行仔细研究之后,提出一种基于l1范数和k近邻融合图的半监督分类算法。本文主要研究工作如下: (1)针对基于图的半监督学习问题,对图的构造方法进行仔细的研究和分析后,提出一种l1范数和k近邻融合图的构造方法。该方法通过l1范数获得数据的全局性,通过k近邻图保持数据的局部性。如此,不仅获得数据的全局性也能保持数据的局部性,从而使所构造出的图可以更接近数据的真实分布。 (2)提出了基于l1范数和k近邻融合(LNKNNF)图的半监督分类算法。将高斯随机场和谐波函数(GHF)以及局部一致和全局一致两种传播算法与所构造的融合图相结合,完成分类任务。 (3)对UCI数据集和USPS手写数据分别进行了实验,将LNKNNF图的分类性能和指数权重图、k近邻图、l1范数图和低秩表示图进行比较,结果表明, 基于l1范数和k近邻融合图分类正确率均高于其他图,使用不同的传播算法仍然有效。
其他文献
数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理因易于实现非线性处理,处理程
随着我国各项法律制度的不断完善和健全,对庭审过程公开、公正高效、真实透明的要求及民众呼声日益增多,为了适应社会形势和经济法制建设发展的需要,加快科技强法步伐,实现公
石油是重要的能源,世界各开采国都十分重视石油的开采,都希望可以精确的分析出地质结构,更有效率的开采出更多的石油。因此精确的分析地质结构是十分必要的,通过分析地层中不同的
在供应链管理中,如何在供应链中各个企业之间实现快速、准确地信息共享已经成为关系到企业经济效益的一个至关重要的因素。实现供应链中信息共享的传统方式有文件传输、共享数据库、远程过程调用等,它们都存在着一定的局限。近年来,基于消息传递的ESB(Enterprise Service Bus)产品不断涌现,它为实现供应链中信息共享提供了一种新的解决方案。ESB是一种基于消息传递的中间件,它采用了“总线”这样
植被是地球上最复杂的生态系统,随着计算机图形学的发展,对植被生长建立模型并对其进行可视化仿真已经成为虚拟现实领域的研究热点。由于植被中植物的生长是一个非常复杂的过
软件测试是软件质量保证的关键,是软件开发中不可缺少的环节,也是软件工程的重要组成部分,软件测试的效果直接关系到软件产品的质量。然而,软件测试是一个十分复杂的过程,需
医学图像非刚性配准在临床诊断、放射治疗规划、图像引导手术、疗效评价等方面具有重要的应用价值,已经成医学图像研究领域热门专题之一。基于B样条的配准是一种常见的非刚性
该文研究了群体智能的多个模型,并将相关模型应用于知识发现.该文的研究目的,一方面是探索和验证群体智能在解决分布式问题方面的特性,另一方面拓展群体智能的应用领域,促进
计算机与通讯技术的飞速发展迫切需要有效的分类方法对信息资源进行分类,而传统的分类方法又存在着费时费力等缺点,这就使得文本的自动分类越来越受人们的重视,支持向量机和
随着云计算受到各界的关注,云计算所提供的云服务数量与种类也随之增加,如何快速发现用户所需要的云服务成为云计算领域中待解决的关键问题。传统的云服务发现方法是以关键字