支持向量机的模型选择研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:gaolch006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量分类中,高斯核不区分样本中各个特征的重要性.显然,各个特征对分类的贡献一般是不相同的,为了体现这种差别从而提高支持向量机的泛化能力,文中提出了多宽度高斯核的概念.多宽度高斯核增加了支持向量机的超级参数,针对这一情况,文中提出了支持向量机的多参数模型选择的算法,该算法利用半径-间隔的泛化误差期望界自动实现模型选择.通过实验验证了多宽度高斯核和多参数模型选择算法在提高支持向量分类中的有效性.高斯核是支持向量机优先选择的核函数,其宽度参数定义了核函数的泛化规模.由于样本分布的不均匀性,单一宽度的高斯核会在样本空间的稠密区域产生过学习现象,在稀疏区域产生欠学习现象,即存在局部泛化风险.针对于此,文中构造了一个“全局性”的次核去降低高斯核产生的局部泛化风险,次核是为了拟补主核的不足,这里高斯核称为主核,构造的新核称为主次核.文中利用幂级数构造性的给出并证明了次核的正定性条件.进一步提出了基于遗传算法的两阶段模型选择去解决主次核的模型选择问题,该算法通过最小化泛化误差界,首先选择主核的模型参数,然后再选择次核的模型参数,实验证明,这一策略是非常有效和鲁棒的.
其他文献
无线通信技术、传感器技术与嵌入式技术的不断进步,促进了低成本、低功耗、多功能的传感器节点快速发展,从而这种由微型传感器节点组成的无线传感网络(Wireless Sensor Netwo
企业是独立的以营利为目的的经济生命体,随着市场竞争的加剧和经济全球化浪潮的日益推进,企业对成本管理和成本核算提出了进一步的需求。当前,企业已不再满足于单一的成本核算管理和落后的成本计算方式。因此,基于先进的成本核算理论,支持多种成本计算方法,并且能够有效的提供更为精确及时的成本核算数据,支持多种层次的成本分析和满足成本控制的要求,进而支持事前计划-事中分析-事后核算的多适应性成本核算成了企业更为明
工作流管理是一项集成业务活动并使其能够自动化/半自动化完成的技术,能够方便人机协同,简化工作复杂度,是计算机科学、自动化科学、管理科学、先进制造等多领域研究的热点问题
数据仓库是随着计算机技术的飞速发展而产生的。由于计算机和网络的广泛应用,计算机开始向两个不同的方向拓展,一是广度计算,一是深度计算。希望计算机能够更多地参与数据分
距离计算、多边形求交等问题是计算机辅助设计与制造(CAD/CAM)、计算几何、机器人和自动化、工程分析、计算机图形学、虚拟现实等领域的基础问题,是解决碰撞检测、路径规划、裁
本文首先介绍了数据仓库技术的相关理论。包括数据仓库的历史及国内外发展现状、数据仓库的定义、数据仓库的数据组织和体系结构、数据集市的概念以及与数据仓库的关系、OLAP
数据库安全涉及到数据库中数据的机密性、完整性、可用性。目前,大部分研究集中在如何保护数据库免受损害,很少有研究数据库在面临着一些成功的攻击时,如何提高自身的容忍能力。
Internet作为信息传播的工具已经应用得十分广泛,在电子投票、电子商务尤其是军事机构等诸多领域对通信双方的身份隐藏是一个基本的要求,因此,兴起了对匿名通信技术及其安全
校园信息门户平台就是指在Internet的环境下,把各种应用系统、数据资源和互联网资源统一集成到校园信息门户之下,根据每个用户使用特点和角色的不同,形成个性化的应用界面,并
无线通信技术是传感器网络的一个非常重要的组成部分,实现传感器网络节点之间的数据传输,无线通信是基础。由于传感器节点具有电源能量有限、通信能力有限、计算和存储能力有