多类文本分类的支持向量机网络

来源 :山东大学 | 被引量 : 0次 | 上传用户:fw1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于统计学习理论的支持向量机算法具有坚实的数学理论基础和严格的理论分析,具有理论完备、全局优化、适应性强、推广能力好等优点,是机器学习中的一种新方法和研究新热点。它使用结构风险最小化原则,综合了统计学习、机器学习和神经网络等方面技术,在最小化经验风险的同时,有效地提高了算法泛化能力。它与传统的机器学习方法相比,具有良好的潜在应用价值和发展前景。本文通过分析和总结现有的几种典型支持向量机算法,提出了一种新的组合SVM新构架,对其算法的性能和应用作了深入研究。主要工作包括:(1)对文本分类的概念、分类技术进行系统地介绍。(2)系统地研究了支持向量机的求解方法。主要有支持向量机的二次规划求解法、选块法、分解法、序列最小优化方法、基于Lagrange函数的迭代求解方法即Lagrange支持向量机、基于Smoothing处理的牛顿求解方法。这些方法是通过求解凸二次规划问题或将大规模问题转化成若干子问题再求解凸二次规划问题,或者是转化为无约束最优化问题再利用比较成熟的最优化方法求解。通过对它们的分析,为提出新的支持向量机算法提供了理论基础。(3)支持向量机原本是为二类分类问题设计的,现在许多研究人员将其推广到多类分类问题上。本文全面总结了目前存在的基于支持向量机的多类别分类方法,包括“一对多”方法、“一对一”方法、一次性求解方法、决策有向无环图方法、基于二叉树的支持向量机多类分类方法,比较了它们的优缺点及性能,提出了一种新的组合SVM的构架。(4)最后,结合文本分类过程和支持向量机方法,设计并实现了一个基于支持向量机新构架的中文文本分类系统。该系统分类效果的评价采用分类问题研究领域普遍采用的查准率、查全率和F测度值等指标。实验结果表明,该系统的这些评判指标总体上的平均值都很高,具有较好的分类效果。
其他文献
近几年,随着手机的普及和移动网络的发展,手机网络游戏越来越受到欢迎。中国拥有超过3亿的手机用户,手机网络游戏具有巨大的市场潜力。游戏引擎是网络游戏的核心部件,它能很好的
无线传感器网络(WSN)已应用于多种领域,例如:环境检测、对象追踪、精确农业、建筑物监测和军事系统等,已有大量的研究工作集中于开发适用WSN的网络协议,尽管这些协议有效延长了网
软件配置管理作为软件开发过程管理和过程改进的基础,开始于软件开发项目之初结束于软件被淘汰之时,支持和控制着整个软件生命周期。当今,软件开发机构不但面临日新月异的技术更
数字水印技术为互联网上的著作权问题提供了解决方案,版权保护是数字水印技术的重要应用之一。本文主要研究的是小波包和小波变换的图像数字水印技术,并结合了新的混沌加密理论
随着计算机应用技术的发展,电子文档的数量呈爆炸的趋势增长。各种形式的电子文档中蕴涵着丰富的信息,但由于它们是以非结构化或半结构化形式存储的,所以无法用传统的数据挖掘方
在多级安全数据库系统中经典的BLP模型的“向上写”规则违反了数据库的完整性约束,并产生隐蔽通道和推理通道问题,解决方法是引入多实例。但引入多实例会引起语义模糊的问题,
数学公式是一类非常特殊的符号表达式。在外形上,它呈现非线性结构,可以用于描述和展示比普通文本更加复杂的逻辑关系;在内容上,它简洁明了,对问题的描述和表达比普通文本更
Internet的发展改变了人们的生活方式,但是网络给人们带来巨大便利的同时也带来了各种各样的安全威胁,网络病毒是其中最主要的部分。随着互联网的发展,网络病毒传播的速度越来越
网络的发展使得世界各地越来越丰富的电子资源信息供人们使用,但是随着数字信息的爆炸性增长,快速有效地获取需要的相关信息却又变得越来越困难,因而对信息获取技术的发展提出了
Internet环境中分布着数目巨大、形式多样、功能各异的可共享资源,如何充分利用网络中丰富的资源、消除信息孤岛是人们一直在致力解决的问题。网格计算技术的出现旨在寻求有