基于密度峰值的聚类算法改进研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:jun_er
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术在世界范围内的快速发展,每天都会产生大规模、高维度、多类型混合的数据,且数据增加的速率也在不断上升,我们正处于以信息爆炸为特征的“大数据”时代。此时,在处理“大数据”时代产生的庞大数据时,传统的处理方式已不足以胜任。如何快速有效地处理大规模数据并从中挖掘有用的信息已成为现在计算机科学领域的一个重要研究课题,在2017年国务院已将计算机科学的重要发展方向一一人工智能上升到国家战略高度。聚类分析是机器学习、数据挖掘领域里处理数据的重要工具之一,它是采用某种方式将数据对象划分为多个类的过程,并使得在同一个类簇内的数据对象尽可能相似,不同类簇的则相异。现已应用到社会上的许多领域,如图像模式识别、病理分析、商务智能、智慧医疗、智慧农业等。密度峰值聚类算法DPC是一种新颖的基于密度的聚类算法,有着易于实现、参数较少且能识别非球形簇的的优点,但该算法目前处于发展阶段,有很多问题需要进一步研究和改进。本文针对密度峰值聚类算法的不足之处提出两种改进措施,具体改进工作如下:(1)对于密度峰值聚类算法在处理大规模数据时计算效率较低的问题,本文提出了一种基于网格预筛选的密度峰值聚类算法(GPDPC)。首先,将数据对象空间分割成多个不相交网格,并将数据对象映射到相应的网格空间内,然后利用网格内数据对象的数量计算网格密度,通过将低密度网格内的所有数据对象筛除掉,减少聚类中心的候选集规模,进而减少选取聚类中心所需要的时间消耗。本文在人工数据集和真实数据集上进行了广泛的试验,结果表明GPDPC算法在保证聚类准确性的前提下,可以在较大程度上减少聚类所需时间消耗,较快实现聚类过程。(2)针对密度峰值聚类算法因为错误地挑选聚类中心而导致的聚类效果差的问题,本文借鉴DBSCAN算法的密度可达概念并在算法内给予重新定义,提出了一种基于密度可达的自适应密度峰值聚类算法的方式(ADRDPC)。首先,在网格分割的基础上,计算每个网格所包含的数据对象的局部密度和相对距离,然后选取每个网格内具有最高局部密度、最大相对距离的数据对象作为初始聚类中心,为之分配类标签,同一个网格内的所有数据对象共属于同一个类簇,最后采用密度可达方法将初始类簇进行合并。通过实验表明,本文提出的基于密度可达的自适应密度峰值聚类算法不仅能够自动完成聚类、而且其聚类准确性也优于其他竞争方法。
其他文献
本文主要采用随机Lyapunov分析方法研究了具有比率型功能反应项、最大生长率受到了随机扰动的恒化器模型的动力学行为.首先给出了随机系统全局正解的存在唯一性,在此基础之上
几十年来,随着计算机科学技术的飞速发展,计算机的计算速度和存储空间快速地增长,这使得我们能够收集、存储和分析高维数据。在多元统计分析中,高维协方差矩阵的统计推断变得
白蚁品级分化具有典型的非遗传多型性。在许多白蚁的种类中,尤其在散白蚁属Reticulitermes中,生殖品级表现出灵活的可塑性。在圆唇散白蚁R. labralis (Hisa)中,由若蚁可以分
蓝藻Synechococcus elongatus PCC7942生物钟的核心振荡器是由kaiA、kaiB和kaiC基因及其编码产物构成,这个核心振荡器负责蓝藻生物节律性时间信息的产生和校准。而作为Kai生
当前粒子物理朝着两个方向发展,一个是高能量前沿,例如大型强子对撞机LHC,其主要物理目标是在更高的能标发现新粒子和新现象,寻找新物理存在的信号;另一个是高精度前沿,例如BE
骨钻孔手术中刀具在切削不同骨质材料时将会产生钻孔力及摩擦热,这会使骨组织受到机械损伤及热损伤,从而影响术后伤口区域的愈合,如何降低钻孔力及热量对骨组织造成的损伤,已成为骨钻孔手术中急需要解决的问题。本文以此背景为研究出发点,研究了钻削骨骼异质复合结构时的力热变化规律及其影响因素,并探究了减少骨组织损伤的最优钻削参数,可为骨钻孔手术中降温减损策略的制定提供理论支持与指导。以金属切削理论中的直角切削分
烟花生产厂房爆炸具有其特殊性:一方面,由于烟花生产厂房为密闭型结构,炸药在厂房结构内部爆炸属于约束爆炸;另一方面,炸药(雷管等)在烟花厂房内分两处存放,具有两处爆源。国
分子势能函数是研究分子光谱性质、力学特性以及电子结构的重要理论依据之一。而对于分子势能函数的讨论,往往从物理学中最基础的体系-双原子分子体系开始,因此,双原子分子势
本文研究了一类常微分方程组熄灭时间最优控制问题的几何结构.考虑的是如下常微分方程组支配的控制系统:首先,将对引入新的变量y0之后的上述常微分方程组支配的控制系统的初值
将GFRP管材、环氧涂层钢筋与海水珊瑚混凝土组合成为一种新型结构—GFRP约束环氧涂层钢筋海水珊瑚混凝土,有利于我国海洋大开发战略的实施和建筑材料的可持续发展。但现阶段关于该方面研究很少,基于此,本文针对GFRP约束环氧涂层钢筋海水珊瑚混凝土轴压力学性能开展了相关研究,主要包括以下工作。(1)研究并分析了在混凝土类型、GFRP管厚度、环氧涂层钢筋纵筋配筋率和体积配箍率等参数影响下,GFRP约束环氧