基于密度衰减图的密度峰值聚类算法研究及应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:ktyl2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代来临,人类社会每天都会产生各种各样、浩如烟海的数据。数据挖掘的主要任务就是从这些庞大、复杂的数据中提取出有用信息。其最重要的方法之一就是聚类分析。聚类分析,作为一种无监督学习方法,解决的主要问题是在缺乏先验知识的情况下从数据中挖掘出潜藏信息。聚类算法可以分为五类:基于划分的聚类算法、基于密度的聚类算法、基于层次的聚类算法、基于网格的聚类算法以及基于模型的聚类算法。其中,基于密度的聚类算法是最广为人知的聚类算法之一,也是本文研究的重点。近年来,由Rodriguez等人提出的密度峰值聚类算法DPC,由于其简洁、高效的特性,成为聚类分析领域研究热点。相关研究成果被广泛用于图像处理、信息安全、大数据等等应用领域。然而DPC存在两个已知问题:(1)在部分数据集上难以通过决策图选择合适的簇中心;(2)DPC存在所谓的连锁反应问题。为此,广大研究者针对这两个问题提出许多改进方法,如Xie等人的FKNN-DPC算法、Zhou等人的IVDPC算法、Xu,Xiao等人的FDPC算法。这些方法虽在不同程度上缓解了问题,但问题并未完全解决。本文围绕如何解决DPC的这两大问题进行了深入的研究,主要贡献如下:(1)在学习理解数据挖掘及聚类分析理论知识基础上,阐述了聚类分析的定义、过程、算法及评价方法,梳理了该领域近期研究的典型算法,并对这些算法的优缺点进行了对比分析。(2)提出了一种新的聚类算法-基于密度衰减图的密度峰值聚类算法Density Decay Graph–Based Density Peak Clustering(DGDPC)。DGDPC的关键创新点是密度衰减图,其灵感来源于自然界中普遍存在的衰减现象。DGDPC首先根据密度衰减图形成初始簇,然后通过一个简单的簇合并过程得到最终结果。跟传统DPC算法相比,该算法无需人工选择簇中心,并且在一定程度上缓解了连锁反应问题。虽然DGDPC引入了一个额外的参数m,但m具有鲁棒性且容易预先确定。在10个合成数据集和10个真实数据集上的实验表明,该算法的总体性能优于DPC、DGB、K-means、DBSCAN和Single-link。(3)为了验证DGDPC的实用性,本文将DGDPC与形状直径函数(SDF)相结合,提出了一种新的三维模型网格分割算法-DGDPC And SDF Based Mesh Segmentation Method(DSMS)。该算法首先计算网格中每个面片形心的厚度(厚度由该点的SDF值经过一系列后处理步骤得到);然后通过类似DGDPC的算法过程,利用厚度衰减图进行网格分割。用户可通过调节参数m,控制分割结果的面块数。DSMS具有良好的稳定性、一致性,且所需的人工干预程度较低。在经典三维模型上的实验证明,大部分情况下DSMS的分割结果优于基于K-means的网格分割算法。
其他文献
移动机器人技术随着智能传感器和人工智能技术的崛起得到迅速的发展,已经从实验室的测试开发样机走进生活和工厂的实际应用中,如餐厅的送餐机器人、家庭的扫地机器人、码头中的重型AGV、快递站的送货机器人等等,移动机器人已经成为人类切实可行不可或缺的帮手。在移动机器人的研究中,采用单一的传感器无论感知环境精度还是路径规划的准确性都不如多传感器的融合。本文通过研究同质类和异质类传感器的融合,对比分析感知环境建
随着我国城市化进程的不断推进,生活垃圾产生与累积量的日益增长,大多数城市出现了垃圾围城的境况。垃圾中转站负责了生活垃圾的压缩与转运工作,是我国生活垃圾管理的关键枢纽。由于我国生活垃圾中的餐厨垃圾占比高,含水量大,压缩转运过程容易产生的大量有害的液体,对周边环境甚至人体健康造成严重危害。因此妥善处理中转站垃圾渗滤液是当下绿色城市建设的一项重要保障。人工湿地技术作为一种高效、环保、经济的污水处理技术,
据国家相关部门统计,近年来我国学生总体近视发病形势逐年严峻,且逐渐呈现低龄化,防控任务愈发艰巨。国内外研究发现,教室作为学生长时间学习的场所,其室内光环境质量与学生的情绪波动、视力健康密切相关,甚至对其他方面的身心健康产生直接影响。因此,利用新型照明技术调节学生情绪、改善视疲劳,并对此展开实验研究,可以为教室健康光环境研究提供一定的实验数据与探索意义。本文研究内容主要分为以下几方面:(1)理论研究
在化工生产、材料合成以及生化分析等过程中,样品溶液的目标组分浓度对检测、合成的准确性及时间成本等有重要的影响。在样品溶液进行正式检测、反应前,提高目标组分的浓度,可提高反应灵敏度、检测准确性以及减少试剂消耗量等。光热驱动蒸发具有响应速度快、灵敏度高等优点,在微流控技术领域展现出良好的应用前景。然而,将光热驱动蒸发应用于微流控芯片的样品浓缩还存在微通道内蒸汽传输受限、两相流动不稳定等问题。因此,开发
导航定位系统在复杂环境下实现稳定、准确的定位,是无人移动平台行为智能化、决策自主化的前提。目前,无人移动平台上配置的全球卫星导航系统或惯性导航系统等单一系统,已经无法满足多场景导航的需求。为解决这个问题,引入多种类型传感器,将其获取的冗余信息进行融合,构建更稳定、更有效的多传感器信息融合定位系统是目前研究的热点问题。本文选择消费级GNSS、IMU和激光雷达传感器,对三种类型传感器数学模型、误差特性
磁耦合无线电能传输(Magnetically-coupled Wireless Power Transfer,MC-WPT)技术是一种新型的能量传输技术,属于无线电能传输(Wireless Power Transfer,WPT)技术的一类,它是通过高频软介质来实现电能的无电气接触的传输,不需要传统的导线连接,从而具有便捷、灵活、安全、可靠等优点。WPT技术在某些特定领域,具有传统电力传输方式无法提
目前的食品质地评价方法主要包括感官评价法和仪器测量法,感官评价法最为接近人类感官实际,但存在一定的主观性和局限性,难以对食品质地得出统一客观的评价结果。仪器测量法通常利用质构仪更换不同形状的压头来对食品进行挤压从而获得质地结果,但压头挤压过程与人类口腔咀嚼运动相差甚远,且无法精确的重现口腔环境温湿度。仿生咀嚼食品质地分析装置即在真实人类口腔系统与结构的基础上,采用逆向工程技术,获取人类口腔真实尺寸
伴随着植物组织培养技术的发展和广泛应用,衍生出了许多围绕植物组织培养技术的自动化生产设备或机器人的相关研究。在组培苗移植的自动化生产过程中,为了让机器能够完成组培苗切割移植作业,需要一套具有视觉功能的系统来完成组培苗植株和组培苗相应部位的识别和定位。针对这个具有挑战性问题,当前尚没有通用的完全可移植的解决方案,因此研究组培苗移植机器人机器视觉系统,进而为机器人的开发提供必要的技术条件,具有重大现实
SAR是一种主动式高分辨率微波成像装置,能全天时、全天候对地实施观测,被广泛用于舰船检测,在民用和军事领域具有重要意义。传统的SAR舰船检测方法在复杂环境下容易错检和漏检目标,不能保证稳定的检测表现。基于深度学习的目标检测算法由于无需人工提取特征、特征表达能力强、检测精度高等优点而广受欢迎。其中基于锚框的算法先被用于SAR舰船检测并达到较好效果,但其严重依赖人为设置的锚框参数,导致检测鲁棒性不够好
本课题来源于国家自然科学基金项目(9204820005)。3K行星减速器具有速比大、体积小等优点,在国防装备、机器人等领域有广泛的应用。其精度、效率和侧隙等是其重要的性能指标。论文针对某低速重载用3K行星减速器的精度、侧隙和效率等特性开展理论和仿真分析。由于加工和安装等导致的偏心误差是形成大周期传动误差和周期性侧隙的主要来源。在变负载工况下,侧隙的存在是导致齿背面啮合时形成的回差也是影响传动精度的