一种非独立同分布下针对数值型数据的PAM改进算法

来源 :齐鲁工业大学学报:自然科学版 | 被引量 : 0次 | 上传用户:gwo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
PAM算法是K-中心点算法中最具代表性的算法。在此算法中,相似性度量的计算方法仅假设数据对象属性之间是独立同分布,采用欧几里得距离公式来进行计算。但现实数据集中,数据对象属性之间是非独立同分布的,即它们之间都是相关联的。因此,本文针对数值型数据,在PAM算法中引入了数值型数据非独立同分布计算公式,将原本的皮尔森相关系数替换为斯皮尔曼等级相关系数,并进行了实验验证。结果显示,数值型数据非独立同分布计算公式的引入很好地提高了PAM算法的聚类精度。
其他文献
对国内外电力变压器油浸绝缘纸的研究进展进行了综述。分析了导致油浸绝缘纸老化、纤维素降解的原因,强调了机械振动因素在油浸绝缘纸热老化过程中的重要性。总结了以纤维素
利用溶胶-凝胶法与水热法制备了氧化锌/硫化镉复合结构材料,通过X射线衍射(XRD)、扫描电镜(SEM)﹑红外光谱(FTIR)及荧光发射光谱(PL)对材料的物相、表面形貌与光学性能进行分析
目的探讨社区儿童疫苗接种不良反应类型、发生原因、处理措施及有效预防对策,为提高社区儿童疫苗接种服务质量、保证疫苗接种效果及安全提供参考。方法 以2015年1月—2017年1
《语文课程标准》中的设计思路写到:课程目标九年一贯整体设计。课程标准在"总目标"之下,分别提出"阶段目标",体现语文课程的整体性和阶段性。……各个学段相互联系,螺旋上升,最终
中学物理是一科难教又难学的学科,它抽象、难懂,使不少学生望而怯步,尤其是一些物理概念、规律,若用单纯的物理语言去讲述它,学生很难理解。但它们又是物理教学中的重点,对于