K-means聚类算法研究及其应用

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:myweiyong168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘的重要技术之一,用于发现数据中未知的分类。K-means算法是基于划分的聚类算法中的一个典型算法,K-means算法有操作简单、速度快、能处理大数据等优点,但是,该算法具有同等对待各属性的缺点。本文对 K-means算法进行赋权研究,主要内容如下:  1.在分析和研究聚类分析和K-means算法的基础上,分别建立了基于CRITIC法加权K-means算法和基于Gini指数加权K-means算法。在实验中,与传统K-means算法进行对比,结果显示了所给改进算法是可行的。  2.结合主观赋权法和客观赋权法对K-means算法进行综合赋权。首先,在已经归一化的数据基础上,运用CV-K-means法确定判断矩阵,根据AHP法计算各属性的主观权重。然后,采用CRITIC法计算各属性的客观权重。最后,根据差异系数法计算组合权重系数,得到各属性的综合权重,从而建立了基于AHP和CRITIC综合赋权的K-means算法。实证研究结果表明:该算法比基于 CRITIC法加权 K-means算法以及传统 K-means算法在聚类精度和聚类熵值都有很大的提高。  3.结合两种客观赋权法对K-means算法进行综合赋权。首先,对数据进行归一化处理,利用 Gini指数法计算各属性的权重。然后,采用 CRITIC法计算各属性的权重。最后,建立求解多属性决策问题属性权重的优化模型,对模型的组合系数进行求解,从而建立了基于Gini指数和CRITIC综合赋权的K-means算法。实证研究结果表明:该算法的聚类结果比基于Gini指数加权K-means算法和传统K-means算法效果好。  4.将本文建立的K-means算法应用于实际的数据中。首先,将改进算法应用于36个大中城市居民消费价格指数,分别从聚类准则函数和聚类密集性对聚类结果进行了分析。然后,将改进算法应用于我国国内生产总值上,分别从Dunn指标和聚类结果对聚类效果进行了分析。通过改进算法在实际数据中的应用,说明了本文改进算法的优势。
其他文献
学位
本文主要研究了含有不同算子的变分包含的迭代解及其应用和逐次渐近φ-强半压缩型有限算子簇的多步迭代程序的收敛性问题,在条件更弱的情况下,我们的结果推广或改进现有的相
学位
学位
本文研究了一般情形下的完全离散复合二项风险模型。我们利用该类模型的强马尔可夫性推导出了赔付时间间隔和赔付时刻盈余的有限维联合密度函数,并据此得到了可以进行数值计
学位
本文主要研究偶数阶非线性微分方程(公式略)的正解的存在性问题,并且给出了在00,q(t)是[0,∞)→(0,∞)的一个连续函数。                               
学位
本文根据前人提供的基本线索,通过深入发掘、利用原始文献,并结合已有的研究成果,深入探究四阶常微分方程基本解法和基本定理的形成过程,利用变分法,对一类具有Ambrosetti-Rabinow
学位