基于回归型支持向量机的数据建模方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:lgshow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)是一种新的数掘建模方法。它以统计学习理论为基础,采用结构风险最小化准则,在最小化样本拟合误差的同时控制学习函数的复杂度,从而提高模型的推广能力。本文针对回归型支持向量机(SVR)算法,从训练速度和推广能力两方面对其展开探讨。 在详细分析SVR算法及其属性的基础上,利用SVR具有稀疏性的性质,提出了一种基于核相似度数据约简的SVR启发式算法(KR-SVR)。该算法利用非线性映射和核技巧将原始空间样本映射到高维特征空间,使样本特征空间更为鲜明,然后根据核相似度对样本进行取舍,在保证推广能力不受太大影响的同时缩小SVR求解规模,从而提高学习速度。多个数值函数仿真结果验证了KR-SVR算法的可行性。 为进一步提高SVR训练速度,本文还利用数学规划中的光滑函数提出了一种基于logistic损失函数的ε不敏感光滑SVR算法(Lε-SSVR)。它将原始SVR中的带约束二次规划问题改造成不带约束的最小化问题,并用拟牛顿法实现求解,减少了求解变量个数,并且简化了传统二次规划中Hessian矩阵的运算,节省了求解时间。数值函数和实际应用例子的仿真结果同样表明Lε-SSVR算法可行。 针对SVR参数(核参数、惩罚因了以及ε不敏感系数)对模型推广能力影响较大,而目前又无解析方法指导SVR参数选取的问题,本文提出了一种基于粒子群优化(PSO)算法的SVR参数选择方法。该方法将SVR参数集当作粒子群,以最小化5-fold交叉验证误差作为适应目标,利用PSO强劲的全局搜索能力实现了参数优选。数值函数和实际应用例子表明该方法对模型推广能力的提高具有很大的作用。 本文最后针对现有模型选择标准无法对模型选择过程给出明确几何意义的问题,探讨了一种基于信息几何的SVR模型选择标准。它将模型空间看作是一个流形,将模型复杂度等价于其所能覆盖的概率分布个数,模型拟合度则视为样本真实分布同模型分布的分散度,由此,直观地解释了SVR求解过程,并明确了模型选择的几何意义。
其他文献
图像分类识别是计算机视觉领域的一个基本问题。一般来说,典型的图像分类识别系统均采用了特征袋模型,由以下三个步骤组成:特征提取、特征编码和分类器设计。特征编码,作为图
淮北地区常年有冬闲地1200余万亩。目前油菜种植面积不到冬闲地面积的10%,如果利用20%的冬闲地种植油菜,面积可发展到200多万亩,几乎相当于近年全省油菜种植面积的一半,则有可
塔式太阳能热发电以高发电质量、高发电效率而被世界各国广泛关注,发达国家都成功运营很多塔式太阳能热发电系统项目。由于塔式太阳能热发电处于初级阶段,国外很多技术都存在专
随着嵌入式系统软硬件技术的发展,其低功耗,小尺寸,实时性高及系统冗余少的特点,越来越多的应用在了机器人的开发上面。正是希望利用嵌入式的这些特点,本文研究了WindowsCE嵌入式
人脑是世界上最复杂的结构,人们一直致力于探索其更深层次的奥秘,渴望揭开这一层神秘的面纱。功能磁共振成像(functional magnetic resonance imaging,fMRI)为人们研究人脑功
【摘要】语言教学不同于技能教学,这一点在英语教学中有着尤为突出的表现。英语教学不仅仅是语言的教授,更是知识和文化的传递。在中职英语的教学过程中,教师不应满足于学生对语法知识等的掌握,还应让学生从教学中掌握不同文化之间的背景与差异。英语教学本来也就是属于跨文化交流的一种。  【关键词】跨文化交流 交际 中职英语 教学  【中图分类号】G71 【文献标识码】A 【文章编号】2095-3089(2015
加热炉是热轧生产线上的一个重要设备,其主要功能是将钢坯加热到符合轧制要求的温度。钢坯加热的质量直接影响钢材成品的质量、产量、能源消耗和轧机寿命。因此,关于加热炉建
随着社会经济的快速发展,人们对移动通信网络的服务质量要求越来越高,但现有通信设施还不能实现全网络的无缝覆盖,直放站则是解决这个问题的一个既经济又有效的选择。直放站自动
粮肥间套复种是用地养地、培肥地力,高产稳产的有效措施.几年来,我们在中低肥力土地上,连续四年进行了“两粮两肥”和“两粮一肥”的间套试验,取得了一定效果.一、粮肥间套
如何考虑不损害已有业主的利益,如何完善社区服务质量和居民区的治安管理,是新政策最难破解的两大命题。经过37年的改革和开放,20年的城市大发展,2月21日,新闻媒体报道了《中