基于K-means算法的最佳聚类数研究

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:suibianlaila
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对聚类算法在实现的过程中需要预先设定最终聚类数目的问题,提出了基于同类全部样本的类内紧密度和类间离差度的一种新聚类有效性指标,通过该指标能够有效地确定数据集的最佳聚类簇数。在确定最佳聚类数的过程中采用K-means算法,针对K-means算法随机选择初始聚类中心的缺陷,提出以欧式距离度量样本相似度,基于样本方差,选出方差最小的前K个样本作为初始聚类中心,避免噪声点成为初始聚类中心,使得选择的初始聚类中心位于样本集稠密区域,Kmeans聚类的结果稳定有效。使用优化K-means算法和新的聚类有效性指标确定
其他文献
针对现有智能变电站SCD文件管控系统在文件上传、下载、存储、共享时存在的耗时长、故障高等问题,该文利用Web服务器设计了一种管控系统。该系统主要包括嵌入式Web文件管理模
针对传统信息系统数据流量实时监控存在精准度低的问题,提出基于SDN的信息系统数据流量实时监控系统设计。依据系统总体架构,设计硬件结构框图,选用具有移动数据传输功能的ab
记事本作为一款纯文本编辑器,以其小巧灵活获得了人们的青睐。为编写一款记事本程序,基于.NET框架,结合Visal Studio 2019编程软件中的Winform窗体程序,采用输入输出流、事件
中尺度底栖生态系中贝类群落对柴油污染效应的初步研究唐森铭,庄栋法(国家海洋局第三海洋研究所,厦门,361005)APRELIMINARYSTUDYONTHERESPONSEOFMOLLUSCCOMMUNITYTODIESELPOLLUTIONSUSI...
锁相环的控制精度取决于提取到的三相并网变流器的基波正序电压信号。针对三相电网电压不平衡、谐波污染及频率突变等情况下不能准确提取幅值、相位等信息,文中采用了正弦幅