【摘 要】
:
在如今的大数据时代,信息的价值体现在各个方面,随着数据的逐渐积累,各个组织结构都希望能够从这个巨大的信息库中获得可利用的有用的信息,所以数据挖掘在各个领域充当着重要的角色。聚类分析作为数据挖掘的重要任务之一,可以在海量数据中挖掘出对象和对象之间关联的信息。许多科研工作者对其展开深入研究。支持向量聚类作为一种重要的基于轮廓聚类的聚类算法,其相对于其他的聚类算法有很多的优点。其一,通过使用核理论可以处
论文部分内容阅读
在如今的大数据时代,信息的价值体现在各个方面,随着数据的逐渐积累,各个组织结构都希望能够从这个巨大的信息库中获得可利用的有用的信息,所以数据挖掘在各个领域充当着重要的角色。聚类分析作为数据挖掘的重要任务之一,可以在海量数据中挖掘出对象和对象之间关联的信息。许多科研工作者对其展开深入研究。支持向量聚类作为一种重要的基于轮廓聚类的聚类算法,其相对于其他的聚类算法有很多的优点。其一,通过使用核理论可以处理结构化数据;其二支持向量聚类作为一种无监督学习算法,可以不用预先得知簇的个数,此点可以扩展算法的使用场景;其三,算法对簇的形状和簇的数量没有要求,其可以识别任意形状的簇;其四,支持向量聚类通过引入软边缘常量,可以识别噪声点,消除噪声点对聚类的影响。但是在集群分区阶段的计算量过大,算法的运行时间耗费较高,同时具有随机操作,使算法划分结果容易受到随机操作的影响。此外,支持向量聚类的聚类结果对参数软边缘常量C和核宽度系数q具有较大的依赖性,寻找最优参数较为耗时。本文介绍了一种基于样本集在特征空间的几何性质提出的基于支持向量划分的簇标识方法。其包括了簇球划分和收敛划分两个模型。簇球划分模型是在得到支持向量集在特征空间中的序列之后,应用跳跃函数将支持向量划分,不同簇的支持向量形成的簇球,包裹属于本簇的多数数据点,减少数据点的错误划分;收敛划分模型通过选取在特征空间与支持向量核函数最大的非支持向量点作为类支持向量点,为支持向量划分提供更多的簇信息,将支持向量与类支持向量之间的核函数的均值作为阈值将支持向量划分,后续通过建立初始数组,从簇的边界逐渐收敛进行簇的标记。算法解决了时间复杂度高的问题,并且减少样本点被错误分簇,保证聚类质量。对算法应用模拟数据集进行聚类效果展示,和经典的数据集进行实验仿真。并且与多种算法以不同聚类评价标准进行对比。实验表明,本文提出的算法具有良好的聚类效果。同时测试算法的聚类耗时,实验证明,算法降低了支持向量聚类算法的时间复杂度。
其他文献
SP3 C-H键活化反应是构建C-C键的一种有效方法,通过活化和诱导C-H键,能够将简单的起始原料直接合成复杂的有机产物,而无需事先引入活化基团,它体现了原子经济性、环境友好性
随着工业化进程的加快和人口的急速增长,人类正面临严峻的能源短缺和环境恶化的危机。太阳能作为一种新能源,具有清洁、高效、可再生等优势,光电化学技术可以将太阳能加以合
离子液体(ILs)作为一种潜在“绿色”反应介质,因有传统溶剂无法比拟的优点而备受关注,在有机合成、萃取分离及纳米材料制备等诸多领域有广阔的应用前景。尤其是在纳米材料制备
《直齋書錄解題》是南宋陳振孫的私家目錄書,在我國目錄學史具有重要地位,其與晁公武《郡齋讀書志》被譽為目錄學雙璧。本文以《直齋書錄解題》詩詞類提要為主要研究對象,一方面總結兩類提要中的文獻學價值;另一方面發掘其中蘊含的文學價值。通過系統的總結兩類內容,使散落在提要中的文學和文獻學價值逐漸清晰起來。近年來學界研究主要集中在文獻學角度,着重討論了《直齋書錄解題》目錄學影響與價值,還有對陳振孫本人加以研究
目的:稀土元素广泛应用于工业、农业、医药和高新技术领域,导致职业和环境暴露,引起人们对与稀土元素相关的健康影响的关注。母亲妊娠期间有毒物质暴露可对后代胎儿期、婴幼
在我国,妊娠期糖尿病、高血压等慢性病严重影响孕产妇的生活质量,而大量的孕产健康领域知识与经验因语义异构不能被共享、复用以辅助医护人员、孕产妇做好孕产期的保健工作,特别是针对妊娠期疾病的预防、诊断和治疗。本体为需要在域中共享信息的研究人员定义了一个通用词汇,解决了知识语义异构的问题。但是,领域本体的构建和展现依赖可视化工具的支持,而现有的本体可视化工具在本体和视图之间建立紧耦合关系,导致工具可移植性
英语致使移动构式([SUBJ[V OBJ OBL]])是指一方通过施加作用力致使另一方发生移动的事件,是英语论元结构构式的一种基本形式。一般说来,英语致使移动构式包括含介词和副词的致使移动表达式两大类,即[SUBJ[V OBJ ADJ]]和[SUBJ[V OBJ ADV]]。自Goldberg(1995)的《构式:论元结构的构式语法研究》一书发表以来,英语致使移动构式越来越受到国内外构式语法学者的
驾驶室翻转缸保压效果的好坏主要取决于翻转缸密封球面的加工质量。为解决目前企业采用传统法加工驾驶室翻转缸密封球面存在的自动化程度低、生产效率低、产品质量一致性差、产品合格率较低以及生产成本高等问题,本文研制出一台驾驶室翻转缸密封球面自动加工设备。本文根据企业对设备提出的技术要求并参考传统法加工过程,确定设备的工作流程。根据设备的工作流程将整机划分成五个子机构,分别是:主体框架、自动上料机构、密封球面
随着我国公路建设浪潮的兴起,加大了对沥青混凝土的需求量,在高等级路面中的需求尤为明显。作为生产沥青混凝土的搅拌设备,其性能影响着沥青混凝土的质量和产量,而在目前搅拌站中,多为人工逐堆装车,人工装车存在装车效率低、装车作业环境差和工作人员重复劳动强度大等问题。为了提高搅拌站沥青混凝土的装车自动化水平和智能化程度,本文提出沥青混凝土智能装车作业模式研究,为沥青混凝土的智能装车提供模型基础。首先,论文综
21世纪,癌症已经成为继心血管疾病之后的全球第二大致死疾病。目前,除了传统的外科手术和辅助放疗或化疗外光热治疗、光动力治疗及免疫疗法等也引起了人们广泛的研究兴趣并取得了显著的疗效。但单一的治疗方式很难达到最佳的治疗效果,所以多种治疗方式的联合治疗显示出其巨大的优势。近年来,纳米技术在科学技术领域得到了快速的发展和应用,纳米载药系统的设计和开发极大的提高了药物的递送效率,增强了癌症的治疗效果。纳米复