基于最近邻相似度的孤立点检测及半监督聚类算去

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:zhanghui1860
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的聚类算法是一种无监督的学习过程,聚类的精度受到相似性度量方式以及数据集中孤立点的影响,并且算法也没有很好的利用先验知识,无法体现用户的需求.因此提出了基于共享最近邻的孤立点检测及半监督聚类算法.该算法采用共享最近邻为相似度,根据数据点的最近邻居数目来判断是否为孤立点,并在删除孤立点的数据集上进行半监督聚类.在半监督聚类过程中加入了经过扩展的先验知识,同时根据图形分割原理对数据集进行聚类.文中使用真实的数据集进行仿真,其仿真结果表明,本文所提出的算法能有效的检测出孤立点,并具有很好的聚类效果.
其他文献
当今社会科学技术发展越来越快,技术难度不断增加,技术创新对所需要的知识和技能的要求越来越高,同时,资源和企业本身更依赖技术创新,体现为不同领域知识的结合。大学、企业以及科研院所在合作技术创新中的地位不同,各自拥有的资源不同,可以利用优势互补,合理利用彼此间的资源来进行密切合作,来突破自身条件的局限性,从而实现技术创新。当今世界的发展对技术创新提出了新要求,产学研合作顺应了这个新环境的要求,从而成为
无线传感器网络能量均衡策略中存在能耗大小的问题.在圆形的网络模型中,通过比较不同分环数下总能耗大小,得出在能量均衡前提下,能耗最小的网络分环数.算法同时能够明确网络
土地批租是城市土地制度的重要组成部分,它对城市经济的发展极具影响。本文以城市土地批租制度为研究对象,系统考查了城市土地的特性、类别、产权和地租理论,回顾了中国城市
在果树行间或果园缺株断行处,科学合理地间作一些农作物,不但可以增加收入,而且还能促进果园的肥水管理。加快果树的生长。但必须注意以下五点:①不宜高。不宜间作玉米、高梁等高秆作物,以免影响果树通风透光条件。宜间作豆类、小麦等矮秆作物。②不宜长。不宜间作生长期长,特别是多年生作物,以免影响果园施肥和耕作。宜间作油菜、大蒜等生长期短的作物。③不宜深。不宜间作深根系作物,以免发生争水、争肥矛盾。宜问作浅根系
期刊