一个二阶段覆盖聚类算法及其应用

来源 :延边大学 | 被引量 : 1次 | 上传用户:zhuyi9021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是研究在没有训练集的情况下对样品进行分类的多元统计和数据分析方法。利用聚类分析方法对给定数据进行分类时,所采用的样品并不知道其所属类型,而根据样品间的“相似”程度来自动地进行分类。聚类分析的主要目的在于把给定数据集按照一定的规则适当地划分成一系列有意义的子集(或称类(clusters)),使得每个类中的样品之间相似程度尽量大,而处在不同类的样品之间尽可能有“较大差异”。一个好的聚类结果,一方面可对给定的数据按其固有的性质所分成的各个类去把握其特征,从而达到浓缩原来数据规模的目的。另一方面可从结构相对复杂的原始数据得到结构更加简单而直观的数据资料,以利于对给定问题做进一步分析和研究。 本文利用覆盖算法的思想,提出二阶段覆盖聚类算法,并在分析过程中对一些特征指标之间相关性大的聚类问题,应用主成分分析方法尽可能克服指标之间的高度相关程度对聚类结果稳定性的影响。力求做到既提高聚类算法的速度又保证聚类结果的有效性。并将通过一些实例分析部分地说明和检验所提出方法的可行性和有效性。
其他文献
本文主要从事两方面的研究工作:一类新混沌系统的控制及其同步问题;推广Liénard系统的混沌控制问题。具体内容如下: 第一章简要介绍了混沌理论的发展历史与现状,重点介绍了混
在这篇论文里,我们研究了几类最优控制问题并且给出了求其最优解的一般算法。在第一章里,我们给出了本文所要讨论的问题。同时,简要回顾了最优控制问题研究现状,以及本文所要讨论
融资结构和控制权安排是现代企业制度的重要组成部分,对现代企业的经营有着及其重要的作用。本文借助企业契约理论和数学模型来研究现代企业最优融资结构和最优控制权安排。
t-设计的构造是组合设计理论中的重要问题,有着重要的理论意义和实际应用背景. t-设计的理论与方法在数理统计、运筹学、信息论和计算机科学中都有着重要的地位.目前有关 2-
在旋转微平行管道内,本文研究了两不相容流体的电渗流问题.通过使用线性泊松玻尔兹曼(Poisson-Boltzmann)方程考虑了双电层(EDL)的电势分布.根据电荷密度分布和在旋转框架内
无线Ad hoc网络是由一组带有无线收发器的移动终端相互协作形成的一种新型网络,在无线通信领域中占有极其重要的地位。因其容易构建、支持用户移动性的特点,使得它在实际生活中