基于改进果蝇优化的密度峰值聚类算法

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:hellolvkui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数字经济飞速发展,特别是5G、人工智能、互联网的普及和应用,使得数据量大幅增长。同时,随着“东数西算”工程的全面启动,对于东部地区数据的计算不仅有科学计算和大数据处理的需求,而且还有增长更快的人工智能训练和推理计算需求。所以就更凸显了作为数据分析有效方式的数据挖掘技术的作用。聚类作为数据挖掘中的一种重要方法,可以挖掘出数据内部的结构信息和相似关系,并将数据对象分为若干个簇。密度峰值聚类算法(Clustering by Fast Search and Find of Density Peaks,DPC)是一种典型高效的聚类方法,可以直观快速地识别任意形状数据集中的类簇,并能高效的分配样本点及有效的剔除离群点,对大规模数据集具有良好的适用性。但该算法的截断距离参数需人工选取,参数选取对聚类结果具有较大的影响。针对DPC算法的不足,本文提出一种基于改进果蝇优化的密度峰值聚类算法。具体工作如下:首先,通过Tent混沌映射初始化果蝇种群,利用Tent混沌序列的特有性质来提高初始种群多样性,增强算法全局探索的能力,并引入动态步长因子与柯西变异策略改进基本果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)的更新机制,加强局部勘探能力,使算法逃出局部最优,6个基准测试函数的实验仿真结果表明改进的FOA算法在收敛速度和求解精度上有明显提高。其次,从随机算法收敛准则的角度对改进FOA算法的收敛性进行了理论分析。然后,为解决DPC算法截断距离参数需人工干预的缺陷,将改进FOA算法与DPC算法融合成新算法,利用改进FOA算法较强的寻优能力找到最佳截断距离。实验结果表明,新算法在4个数据集上的聚类性能均有改善,而且具有更优的性能指标,有效抑制了手动选取截断距离参数带来的影响问题。最后,将改进后的密度峰值聚类算法应用到了经济财务数据集的分析中。对从国泰安数据库中获得的6个能反映企业发展趋势的财务指标数据进行聚类分析,以划分各企业的类型,使企业投资者作出合理正确的选择。实验结果表明本文算法在经济领域的数据分析中具有良好的应用价值。
其他文献
我国《民法典》仅在第1023条对声音权益的许可和保护做出参照适用的规定。这一规定导致了对声音权的界定和侵权形态均不够明晰,对声音的许可使用和法律保护解读不一,对于声音合理使用的范围、声音模仿是否构成侵权以及侵权救济方式也有待明确。在解释上,应认为声音权的内容包括声音的录制、使用、公开以及许可。声音侵权的形态包括擅自录制、使用、公开录音以及利用信息技术伪造声音。在许可使用上,应适用《民法典》第102
期刊
目的:研讨乳腺癌早期诊断中应用超声诊断技术扫查的临床价值。方法:选取2019年1月—2021年10月成武县人民医院诊治的50例乳腺肿瘤患者资料,所选患者均行彩色多普勒超声检查(color Doppler ultrasonography,CDS),结合患者的外科和病理学资料,评估CDS对乳腺肿瘤的诊断效能,并分析其声像图特征。结果:50例乳腺肿瘤患者均由外科和病理学证实,其中24例(48.00%)为
期刊
在生物、化学、物理、控制理论、力学、动力系统等领域对现实世界进行数学建模往往会涉及分数阶微积分.分数阶微积分定义的多样性如Caputo,Hadamard,Riemann-Liouville(R-L),Caputo-Hadamard型等,使得人们有机会选择最合适的导数去描述现实世界的复杂问题.单调迭代方法作为获得非线性问题极值解的有效工具,被诸多学者用来研究整数阶和分数阶微分方程.本文主要研究几类具
学位
近年来我国风电机组装机规模持续扩大,总装机超过3亿k W,稳居全球第一。但是,由于风况环境复杂引起的风电机组重大事故也不少,给风力发电行业的发展带来巨大挑战。而风电机组运行状态不仅决定发电产量还关系着其健康寿命。因此,风电机组运行维护成为风力发电领域关注的热点。目前,在风电机组部件故障预警、运行策略等方面的研究取得了一定成果。现有文章大多是研究基于单一评估模型对机组部件健康状态进行评估,针对机组整
学位
针对广义马尔可夫跳变系统,目前在鲁棒稳定性、耗散性、H∞控制、滑模控制以及容错控制等方面取得了一些研究成果。现有的容错控制结果大多是研究含有一种故障的广义马尔可夫跳变系统,但由于在系统运行过程中有可能同时出现执行器故障与传感器故障,所以在观测器设计过程中需要充分考虑多种故障引起的不利影响。因此研究同时含有多种故障的广义马尔可夫跳变系统更具有实际意义。本文研究了具有多种故障的广义马尔可夫跳变系统的容
学位
分数阶微分方程被广泛运用于材料模型、航空航天工程、生物种群模型等领域.相比于整数阶微分方程,分数阶微分方程在描述一些物理和化学现象时,往往比整数阶微分方程更加准确.当前,大部分学者主要是利用不动点理论,变分方法及谱理论等方法研究分数阶微分方程BVP解的存在性和多解性,但同时对其解进行模拟仿真的结果比较少.众所周知,在给出微分方程解的存在性的同时对其解进行模拟仿真,更能从直观上理解解的性态.因此,本
学位
在现代社会生活中,人们对图像的要求越来越高。对于实际应用中难以直接实现图像部分区域风格迁移的问题,提出了基于卷积神经网的图像局部风格迁移算法。目前,图像风格迁移算法主要基于图像优化和基于模型优化2类。第1类算法将图像中的所有像素点作为参数,通过迭代优化的方式改变图像中像素点的值使其符合风格图像的特征分布。而第2类算法通过对模型的训练使其学习到风格图像中的特征信息,从而直接将内容图像映射为风格迁移图
学位
随着爱因斯坦的相对论的发展,伪欧氏空间得到了广大学者的重视.伪欧氏空间中曲线的研究也得到了很大的突破.特别是负指标为1的Minkowski空间不仅与物理学密切相关,而且为天体物理学和宇宙学的研究提供了理论和方法支持.因此研究伪欧氏空间中的曲线具有十分重要的意义.本文主要研究内容如下:通过在四维Minkowski空间中定义伪零曲线的结构函数,得到了曲率函数与结构函数之间的关系,并利用结构函数给出了伪
学位
随着社会的不断发展,生态环境以及生态平衡问题越来越成为人们关注的焦点问题。对于如今生态环境逐渐恶化的问题,人们不得不对其施加人工控制。同时,对于为收获经济效益而建立的人工生态系统也需要人为的控制使之达到平衡状态。但是,在实际应用中,人们很难保证在采集生物物种信息或对生物系统进行控制的过程中不会出现错误或误差。也就是说,当系统自身出现故障时,人们需要提出一种控制方法来保证系统的稳定性。因此,本文将容
学位
在自然界及人类生活、生产中,随机因素客观存在且不可避免,将随机模型与广义系统相结合,是现代控制理论发展的一大方向。近年来,广义随机系统在众多实际应用领域中扮演着不可或缺的主角。无论是在某一领域应用还是对广义随机系统本身而言,难免会出现各种各样的故障与外界干扰等问题,为了消除此类问题带来的影响,设计一种故障诊断方法来保证系统的平稳运行,是极其必要且具有非常重要的实际意义。目前,故障诊断的容错控制问题
学位