最小VC维分类器的一种实现方法

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:huoxingtan22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习的重要基础是传统的统计学,其前提是有足够多的样本,但当样本数目有限时难以取得理想的效果。统计学习理论(Statistical Learning Theory或SLT)是由Vapnik等人提出的一种小样本统计理论,着重研究小样本情况下的统计规律及学习方法。SLT为机器学习问题建立了一个较好的理论框架,也发展出一种通用学习算法——支持向量机(Support Vector Machines或SVM),能够较好地解决小样本学习问题。正因为SVM有较为完备的理论基础和较好的学习性能,使得它成为继神经网络研究之后的研究热点。尽管SVM的性能在许多实际问题中得到了验证,但其核参数的选择依然是支持向量机研究领域的一个待解决问题。通常情况下,SVM算法中核参数是事先确定的。本文中最小VC维分类器的非线性约束规划问题中包含了RBF核参数,可以在算法执行中自适应地确定。本文旨在找到一个快速求解最小VC维分类器的方法。本文从统计学习理论出发,介绍了控制学习过程的推广能力、结构风险最小化原则和支持向量机。对支持向量机的各种实现算法进行分析和总结,特别详细介绍了后面我们用到的Osuna分解方法的基本思想和实现思路。简要地介绍了与本文有关的三种优化算法:梯度法、罚函数法以及复形调优法。在介绍了最小VC维分类器的基本原理基础上,本文提出求解最小VC维分类器的基本算法,其核心是用梯度法结合罚函数法求得非线性约束规划的一个初始可行解,在此基础上利用复形调优法求解最小VC维分类器的非线性约束规划问题。试验证明,基本算法能较好的对数据进行分类。但随着样本数量的增加,该求解方法处理样本的速度会越来越慢,以至最终无法处理。针对求解最小VC维分类器基本算法中存在的缺陷,本文根据Osuna分解算法的思想。提出了一种求解最小VC维分类器的改进算法。即将大规模非线性约束规划问题分解成一系列小规模非线性约束规划问题进行求解。通过试验证明引入分解算法后的改进算法有较好的分类性能和计算速度。改进算法和常用SVM算法之一的SVMlight算法比较可得:在分类性能上改进方法和SVMlight相当,在分类速度上较SVMlight更快。
其他文献
随着我国社会经济的迅猛发展,快餐业也不断焕发新的活力,在国民经济中起着至关重要的作用。麦当劳(McDonald)作为西式连锁快餐企业的代表,于1990年进入中国内地市场,截至2018年11月,中国内地有超过2900家麦当劳餐厅,员工人数超过15万,在快餐业市场占据了巨大的市场份额,赢得了广大顾客的青睐和认同。然而,随之电商模式的日益成熟、西式快餐同质化影响和中餐连锁企业的快速发展冲击,麦当劳从各方
对光伏系统最大功率点跟踪(MPPT)问题进行研究,针对常规自适应电导增量法结构复杂、动态响应慢等缺点,提出一种改进自适应增量电导算法。其原理是通过检测瞬时电导和电导增量
施工项目的建设过程中,成本管理是极为重要的一个环节。但由于建设一个施工项目所需的环节众多,工艺复杂,成本繁琐,很多企业在针对成本管理缺乏有效的方法,在进行成本管理时,
1949年建国至今,中国历经了从一穷二白到全球第二大经济体的变革。综合国力大幅提升、国际影响力显著提高,百姓生活更是有了翻天覆地的变化。但粗放式的经济发展模式带来了许多污染问题。随着环保意识的提高,人们意识到经济的发展不能以环境的损害为代价,人们越来越注重节能减排、低碳环保这些问题。像传统产业琉璃瓦的生产与制造同样面临着这些困扰。通过调研发现,琉璃瓦产业主要面临如下两个问题:一是炉窑烧制污染严重,
以农村的乡风民俗为载体,以农民的自身经营为主体,以市民的娱乐放松为愿景的乡村旅游是一二三产业融合发展的新业态,是促进农村经济发展和农民增收的新途径,是农业功能和旅游模式的新拓展。发展乡村旅游对完善农村利益连接机制,推动农业供给侧结构性改革、改善乡村基础设施建设、保护传承传统文化资源具有重要作用。对乡村振兴战略的实施和全面建成小康社会的目标实现具有重要意义。因此,从产业融合视角研究乡村旅游发展显得尤
新时期以来,报告文学依恃百年积累及文体优势,发展迅猛、持续繁荣,影响广泛、成就显著:不但涌现了众多杰出、优秀的作家作品,而且形成了众多特色鲜明、风格迥异的群体流派。然而,与