数据挖掘中若干数学模型与算法研究

被引量 : 0次 | 上传用户：lqzhou

【摘要】

：

近年来,由于计算机和信息技术的快速发展,人们需要花费昂贵的代价收集、存储和处理海量的数据。如何“去粗取精”,从中发现有用的信息,已经成为一个迫切需要解决的问题。数据

【作者】

：

滕月阳

【发表日期】

：

2005年期

【关键词】

：

数据挖掘数学规划支持向量机在线学习增量学习特征提取聚类分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,由于计算机和信息技术的快速发展,人们需要花费昂贵的代价收集、存储和处理海量的数据。如何“去粗取精”,从中发现有用的信息,已经成为一个迫切需要解决的问题。数据挖掘技术在这种背景下应运而生。数据挖掘的定义就是:在数据库中发现有用的、潜在的、最终可理解的模式的非平凡过程。它是一门内容广泛的交叉学科,涉及机器学习、数学规划、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。数学规划是运筹学一个重要分支,在机器学习、网络问题、博弈理论与经济学、工程机械学等领域有着广泛而重要的应用,是国际上最活跃的运筹学研究领域之一。现在,数学规划得到极大的发展,和其他学科结合形成新的研究领域,并不断在新的领域找到应用。数学规划和数据挖掘技术的结合已使大规模和高复杂性的问题的解决成为可能。数学规划在特征提取、聚类和回归等方面有很重要的应用,而这些都是数据挖掘亟待解决的问题。本文主要致力于支持向量机、近似支持向量机的学习算法研究,特征提取的数学模型与算法的改进及其应用,聚类分析算法的收敛性证明。支持向量机是数学规划在数据挖掘领域的一个重要应用。支持向量机是Vapnik等人根据统计学习理论提出的一种新的机器学习方法,其本质是数学规划中的二次规划。如何准确、快速求解二次规划是支持向量机研究的基本问题,而这些问题的解决与数学规划中的优化理论密切相关。本文研究了支持向量机与近似支持向量机的在线学习算法,并将支持向量机增量学习算法应用于蛋白质二级结构预测,取得了很好的结果。特征提取指的是意识到存在无关而多余的特征并要剔除它们,同时对两个集合进行区分。现存模型在区分高维数据(例如脑科学中几十万维的数据)时需要的时间和空间代价很高,因此需要对有用的特征进行提取。本文对已有支持向量机的特征提取方法进行了改进。最后将本文的方法应用于一个经典的著作权分析问题-The DisputedFederalist Papers-通过与已有机器学习结果不同的特征得到了与经典著作权分析方法相同的结论。聚类分析也是数据挖掘中比较常用的方法,它是一种无监督的学习方法。本文给出了一种k-means聚类分析算法的收敛性证明,为算法的使用提供可靠的理论保证。数据挖掘中若干数学模型与算法研究本文的意义在于:改进数据挖掘中若干数学模型和算法,提高了它们对现实数据的适应性;尝试将这些方法应用于新的领域,拓宽了它们的使用范围;给出了一种聚类算法的收敛性证明,为算法提供可靠的理论保证。关键词:数据挖掘;数学规划;支持向量机;在线学习;增量学习:特征提取:聚类分析

其他文献

运用减法意义解决图文实际问题的教学策略探讨

减法意义是小学数学的重要模型之一,在日常生活和生产中有着广泛应用。图文呈现的实际问题就是模拟现实情境,让学生在解决问题的过程中更好地理解减法的意义。从学生在运用减

期刊

减法意义解决问题学习障碍教学策略

太阳敏感器SoC数据采集模块设计与验证

随着特征尺寸的减小，集成电路的集成度越来越高，将整个系统集成在一个芯片上的SoC成为微电子的重要发展方向。在嵌入式应用领域，SoC以其体积小、重量轻、高性能的特点取代板级系

学位

直接存储器访问数据采集片上系统现场可编程门阵列高级高性能总线

胰岛素样生长因子-1与糖尿病肾病的研究进展

糖尿病肾病是糖尿病主要的微血管并发症,是糖尿病患者主要的死亡原因之一。胰岛素样生长因子-1(IGF-1)通过与IGF-1受体结合发挥生物学作用,在肾系膜细胞产生一氧化氮,增加系

期刊

胰岛素样生长因子-1糖尿病肾病高亲和力胰岛素样生长因子结合蛋白

一种自适应多模式混合控制直流—直流降压转换器芯片的研究

直流-直流电压转换器控制芯片在移动电子产品中得到了广泛应用。由于供能和设备可用空间受到极大的限制，设计者需要达成的首要目标便是如何在尽可能简单的控制技术和小的芯片

学位

DC-DC转换器混合控制降压拓扑迟滞控制高效

中药“脐透消臌贴膏”敷脐治疗肝硬化门脉高压疗效观察

目的:观察自制中药"脐透消臌贴膏"对肝硬化门脉系统血流动力学的影响。方法:120例肝硬化门脉高压患者随机分为两组,在常规治疗基础上,治疗组(66例)"脐透消臌贴膏"敷于脐部;对

会议

肝硬化中药脐透消臌贴膏门静脉高压门静脉血流动力学

俄美中亚“大博弈”的攻守逆转及地缘政治走向

大国角逐，即“大博弈”是中亚地缘政治的主题之一。2010年，一直被视为俄罗斯“后院”的包括中亚在内的独联体地区，发生了四月政变、七月俄哈白关税联盟，以及独联体九国莫斯科会议

期刊

俄罗斯、美国、中亚大博弈走向

GRIN介质光波导耦合器光传输特性分析

随着微纳光子学的发展，光子集成的主要趋势是怎样减小器件的尺寸，这就要求导波结构的微型化。SOI波导在这一方面因包层和芯层材料之间较大的折射率差，对光场有较强的限制作用，结

学位

光耦合GRIN介质SOI波导有限元

小动物图形视网膜电图、多焦视网膜电图的记录及影响因素

随着现代视觉电生理的发展,视觉诱发电位(visual evokedpotentials,VEP)、视网膜电图(electroretinogram,ERG),以及近年来出现的多焦视网膜电图(multifocal electroretinogra

学位

大鼠小鼠豚鼠视觉电生理视网膜电图视觉诱发电位图形视网膜电图多焦视网膜电图

不动之动的秘密——浅析阿恩海姆“张力”理论

张力理论是阿恩海姆艺术研究的重要组成部分之一,鲁道夫·阿恩海姆在《艺术与视知觉》一书中用了一个章节来明确阐述张力所表现的内容以及含义。视觉是再普通不过的感知能力,

期刊

张力阿恩海姆运动视觉感知

恰玛古饮料工艺技术研究

以恰玛古为原料,对恰玛古饮料生产加工工艺进行研究。通过对恰玛古饮料的单因素、正交试验分析得到最佳配方:糖7%,柠檬酸0.11%,蜂蜜0.9%,稳定剂0.15%。影响因素以柠檬酸为主,

期刊

恰玛古试验内容单因素正交试验

数据挖掘中若干数学模型与算法研究

其他学术论文