基于DBSCAN的自适应聚类算法研究

来源 :长沙理工大学 | 被引量 : 11次 | 上传用户:firefly_xk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和通信信息技术的爆炸式发展,在很多领域内积累了海量的数据,这些庞杂的数据隐藏着很多有价值的信息,人们希望能够从中获得有用信息,来高效地推进社会经济的发展。这种需求导致了数据挖掘(Data Mining)技术的诞生,它是计算机与信息技术领域最热门的应用价值极高的研究方向之一。聚类(Clustering)技术是数据挖掘应用中的不可或缺的一部分,作为一个非常热门的研究内容,其主要目标是利用并分析数据间的相关特性来识别聚类对象的划分类别。本文主要研究了DBSCAN算法中聚类参数的自适应确定的问题,以及基于网格密度划分的增量聚类方法,具体的研究内容如下:1.根据核密度估计的基本理论,分析了有关DBSCAN聚类方法的优势和缺陷,采用非参数核密度估计理论来分析数据样本的分布特征的思想,研究和改进了一种自动确定Eps和minPts参数的方法,该方法能够选取恰当的Eps和minPts参数,处理过程中不再需要指定聚类参数,整个过程自动完成。实验和仿真结果表明该方法不但提高了聚类效率,还能自适应地确定两个聚类参数。2.根据增量算法的基本思路,利用了一种网格密度的划分方法,并借助前一章参数自适应的方法,研究了一种基于DBSCAN的动态增量聚类方法。该方法不必像传统的增量算法那样,更新一次样本数据集就聚类一次,只要对目标样本扫描一次,获取划分的每个网格单元的内容和信息,最后分别对这些划分的有限个网格单元进行处理,并将聚类信息映射到最终的结果中。实验和仿真结果说明该算法能够有效地处理数据更新的问题,效率高且复杂度低,简单有效。
其他文献
随着虚拟现实技术的发展,对三维虚拟人的研究成为虚拟现实领域的热点。在电视动画和计算机游戏中,逼真的模型给人以良好的视觉效果。近些年来,越来越多的学者对虚拟人的建模
P2P技术是本世纪初兴起的热点研究课题,指的是网络中对等实体之间的协作通信模式。P2P技术自诞生之日起便获得业界高度的关注,因特网上的P2P应用也从最初的文件共享发展到实时
数字集群技术从20世纪90年代中期在全球范围内兴起,以TETRA体制为主,得到了广泛的应用并取得了良好的社会效益和经济效益。TETRA数字集群系统主要由区域交换机、移动台、基站、
软交换技术是下一代通信网络主流实现方案之一。国内各大运营商已开始部署全国范围的软交换网络,由此实现了越来越多的新业务,对网络管理提出了新的要求。传统的网管设计方法已
21世纪是信息和数据的时代,随着社会的计算机化快速发展使得大量的数据从我们生活的每个角落涌出。数据量的增长速度在各行各业中呈现几何指数增长,这是比以往任何时候都要快
无线传感器网络作为一种新型的Ad hoc网络,相对于传统的无线网络具有覆盖面广、组建方便、抗毁性强等优势,正在医疗、自然灾难监控、军事等各种领域得到越来越广泛的应用。本文
第三代移动通信系统中无线资源管理(RRM)起着重要的作用。负载控制是无线资源管理中重要的组成部分,它通过为不同业务选择合适的实时传输参数,保证了业务的服务质量(QoS)和系统
随着互联网的蓬勃发展,未来的宽带无线通信系统将提供高数据传输速率来满足各种多媒体业务需求。多输入多输出(MIMO)技术和正交频分复用(OFDM)技术作为下一代移动通信系统的关