具有共享近邻的聚类技术

来源 :江南大学 | 被引量 : 0次 | 上传用户:Q529801428
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚类目前已经成为聚类的主要方法之一,但传统谱聚类算法的相似度量方法不能很好地揭示未能完全分离的数据集的真正聚类,而基于共享近邻紧密度的谱聚类算法能够有效地改善该问题,提升聚类质量。故本文主要对基于共享近邻紧密度的谱聚类算法进行了研究,具体工作内容如下所述:(1)针对因基于共享近邻紧密度的谱聚类算法的计算时间复杂度和空间复杂度较高,当处理大规模和高维数据时,其时间开销较大,代价太昂贵,算法有可能会因为系统内存不足的原因而失效等原因,提出了一种它的增量版本来改进聚类的性能。该算法的思想是先将数据集分解为若干子集,然后以增量的方式在每个子集上运行,从而保证其具有良好的聚类性能。通过对人工数据集和仿真数据集进行大量的实验验证了本文的谱聚类算法的有效性。同时,该算法的时间消耗低,聚类精度高,且能够有效的对不断增加的数据集进行聚类。(2)针对由于传统的拉普拉斯矩阵通常会受噪音干扰或者来自于底层分布的有些偏颇的样本,致使计算出的指示向量不同于真实的向量值,故在本文算法中特征向量由拉普拉斯矩阵和分区级副信息算得;此外,将高斯核模糊聚类加入到基于共享近邻紧密度的约束谱聚类算法中,可以使其具有核函数和模糊数学的双重优势,从而弥补谱聚类算法中由于谱聚类算法硬划分的特性而对聚类结果产生的影响。实验结果验证了所提出的基于共享近邻的高斯核模糊分区约束谱聚类算法(GKCSNN)的有效性。
其他文献
随着信息技术的飞速发展,移动互联网络广泛普及,大量快速更新的数据使得现实问题复杂度随之增加。如何高效快速进行大数据分析,引起学者广泛关注。大数据研究旨在大量动态变
随着科技的发展,人类对能源的需求量逐年提升,传统化石燃料为主的的能源结构给环境带来了巨大的压力,温室效应、大气污染及雾霾等问题日益突出。为了解决以上问题,寻找清洁的
携带轨道角动量的涡旋电磁波是一种特殊的电磁波,其相位波前与传统平面波不同,具有螺旋式相位分布,在旋转目标的检测方面具有独特的优势。基于涡旋电磁波探测旋转目标时形成
准确、高分辨率的人口空间分布信息对城市规划、灾害评估、疾病预防以及精准扶贫等都具有重要的参考价值。然而,传统的人口空间化研究存在模型单一、建模辅助因子单一、格网
我国西部地区地形复杂,容易发生道路边坡落石灾害侵占道路,阻塞交通。为了保障交通通行,需要及时对道路侵害程度进行评估,向有关部门汇报。本文提出了一套基于平行双目视觉的
随着处理器技术的发展以及应用对计算需求的增长,微处理器片上集成的资源与核心数越来越多,呈现出异构众核的发展趋势。我国性能最强的超级计算机神威·太湖之光便由40960个
随着智能制造的飞速发展,工业领域对流量监测提出了更高的要求。涡轮流量计作为流量监测领域中大量应用的传感器,其传统感应线圈易受电磁干扰的影响,精度不高;且当前流量计智
本文立意从生产函数定义的角度出发估计总量生产函数。生产函数定义要求生产函数应当反映要素投入与最大产出之间的关系,要素投入与实际产出是可知的,而最大产出却是一个模糊
随着人类对太空探索的不断深入,空间机械臂作为一个操作工具起到着十分重要的作用。在复杂且未知的太空领域,空间机械臂能够帮助人类完成许多高危任务,而且也能够提高工作的
光纤激光器性能优越,应用前景广阔。但是伴随着光纤激光器输出功率的提升,由非线性效应等因素造成的光束质量退化严重制约了光纤激光器的应用。多模光纤激光器受非线性等因素